5月23日,「鯤鵬昇騰開發者大會2025」上,華為昇騰計算業務總裁張迪煊圍繞「一起昇騰 共綻光芒」解讀了昇騰ai的技術戰略與生態布局。他表示,昇騰異構計算架構cann(compute architecture for neural networks)作為昇騰ai的核心軟件平台,始終以「使能每一位創新者」為目標,堅持深度開放策略,持續技術創新,釋放硬件極致潛能,推動ai開發效率與性能的雙重突破。本次大會帶來了多項重磅技術升級,並通過構建全面開放的創新生態與極致效能的算力底座,攜手全球開發者加速ai技術向千行萬業滲透,以智能算力革命重塑產業創新範式。
生態構建開發者賦能:從人才培養到生態共建 激活產業創新活力
昇騰cann以"使能每一位創新者"為核心理念,自2023年宣布深度開放以來,通過多維協同創新構建開發者友好型ai生態,當前由6000+認證開發者組成的創新社區持續釋放技術勢能。截至目前,已攜手互聯網、運營商、金融等30多個夥伴,創新開發260多個高性能算子,大幅提升業務場景性能表現。
cann在技術創新之路上成果豐碩。在操作系統層面,打造多樣化os,兼容鴻蒙、歐拉等,為開發運行築牢根基。cann開源算子加速庫、通信算法、ascend c、集合通信庫等組件已在gitee社區上線260+算子、10+通信算法參考樣例,顯著提升開發效率。整圖優化方面,提供內存復用、自動調度等加速技術,加速模型計算效率。
這種"基礎層開放+應用層共創"的雙輪驅動模式,不僅重塑了ai算力效能邊界,更推動了ai產業鏈的協同進化,形成從技術突破到商業轉化的生態閉環。
深度開放再升級:分層架構匹配多元開發場景 開發效率顯著提升
在ai開發效率成為產業競爭焦點的當下,昇騰cann通過分層開放架構實現技術普惠化躍遷,構建起覆蓋算子開發、系統調優到編譯鏈優化的全場景賦能體系,實現「效率與性能兼得」的開發體驗升級:
最佳實踐賦能,降低開發門檻:發佈catlass算子模板庫,分層提供device層調用接口、kernel層完整實現及block/tile/basic層拆解源碼,實現matmul開發周期縮至50%;開源ascend c 2.0並提供豐富開發接口,結合算子加速庫(aol)與集合通信庫(hccl),搭配gitee社區參考樣例,助力開發者快速完成算子開發與調優。
開放底層原子能力,釋放極致性能:開放190+runtime運行時接口,提供底層原子級能力,支持靈活組合,允許開發者直接調用npu硬件的原子級能力,實現整圖調度優化與硬件性能極限挖掘。
畢昇編譯器構建開放生態,兼容主流開發體系:畢昇編譯器以「全鏈路優化+生態兼容」為核心,打造開發者友好型工具鏈。在編譯優化層面,前端支持異構混合編程,中端優化使算子性能提升20%+,後端實現內存問題分鐘級定位;在生態開放層面,開放ascendnpu ir接口,實現開發者「無感遷移」開發體驗,同時通過開源社區持續輸出技術能力,推動昇騰與全球ai開發生態的深度融合。在生態建設上,通過畢昇編譯器的升級與開放,實現與triton、flagtree等第三方編程框架的無感對接。
昇騰cann核心技術引領:計算-內存-通信"三駕馬車"重構ai算力基因
伴隨ai技術持續突破,模型優化技術從「模型結構創新」延伸到「訓推全流程」算法創新,從模型層面算法優化,下探到底層硬件資源的極致利用。cann是充分釋放處理器極致性能的關鍵,今年昇騰在計算加速、通信加速、內存優化三大領域協同發力,持續釋放硬件價值,創新加速技術,以滿足前沿模型架構及工程創新的發展訴求。
在計算優化領域,通過mlapo融合算子技術,將moe模型中13個串行小算子整合為超級大算子,結合vector與cube計算單元並行處理,使計算耗時從109ms降至45ms,性能提升超142%,顯著釋放硬件計算潛力。
通信效率突破上,npudirect通信算法革新傳統rdma異步通信模式,實現「單消息一次同步」機制,使小包通信耗時降低90%,整網通信時延減少50%,在大規模moe模型推理中大幅提升數據傳輸效率。
內存管理方面,創新多重地址映射技術,動態切分物理內存適配虛擬地址,有效拼接不連續空閑內存,將內存利用率提升20%以上,破解動態shape場景下的碎片難題。
三大技術協同突破,構建起昇騰cann「計算高效、通信敏捷、內存精細」的底層技術體系,為ai模型訓推全流程提供極致算力支撐,引領ai基礎設施性能躍遷。
從分層開放的生態裂變到計算-內存-通信的原子級突破,昇騰cann正以"技術縱深的突破與生態廣度的延展"雙輪驅動,重塑ai產業的創新範式。這不僅是一場硬件算力的革命,更是一場開發者與技術的共進化。在這場波瀾壯闊的算力躍升征途中,昇騰cann不僅是中國ai創新的技術底座,更是全球開發者突破想像邊界的星辰大海——以開放之姿,與時代共昇騰;以極致之力,與未來共綻放。