破局!國產AI芯片,從“依賴進口”轉向“自主可控”的關鍵轉折!

中國變化太快了!——這是全球科技產業共同的心聲!

3月24日DeepSeek上線最新的大模型版本DeepSeek-V3,參數量為6850億,在代碼、數學、推理等多個方面的能力再次顯著提升,甚至代碼能力追平美國Anthropic公司大模型Claude 3.7。

就在同一天,根據彭博社消息,螞蟻集團通過採用阿里巴巴、華為昇騰等國產芯片,結合混合專家模型(MoE)架構,成功將AI大模型訓練成本降低20%,單萬億Token訓練成本從635萬元降至508萬元,而性能卻能與英偉達H800芯片訓練的頂級模型相匹敵

如上所述,由於DeepSeek的持續進化,國產AI的技術和能力已經接近全球最高水平,就如3月25日李開復所言:中國在某些領域已將其與美國在AI發展方面的差距縮小至只剩三個月,因為DeepSeek等公司已經摸索出如何更有效地利用芯片和應用算法

但AI芯片始終是困擾國產AI發展的一大障礙,而此次螞蟻百靈憑藉國產芯片訓練,實現同等性能突破,還將訓練成本再降20%;不僅撕開了西方技術壟斷的鐵幕,更標誌着中國AI產業從“依賴進口”轉向“自主可控”的關鍵轉折

據了解,此次螞蟻百靈核心算力來自以下國產芯片生態:

1、阿里巴巴自研AI芯片:作為阿里雲底層算力的核心,其性能在分布式訓練中展現出高並行處理能力;

2、華為昇騰系列:昇騰910B芯片憑藉達芬奇架構和異構計算優勢,支撐了MoE模型的複雜路由機制;

3、壁仞科技BR系列:專為大規模AI訓練設計,支持高帶寬內存與低延遲通信;

4、天數智芯BI系列:通過軟硬協同優化,提升低性能設備上的計算效率;

5、寒武紀思元系列在稀疏計算和動態負載分配上表現突出。

這些芯片通過異構計算平台的整合,構建了一個去中心化的算力網絡,實現了“用中端硬件跑高端任務”的逆襲。

另外,值得一提的是,螞蟻百靈不僅核心算力來自國產芯片,同時還在三大核心技術上實現了突破。具體如下:

1、模型架構動態適配:根據國產芯片特性,調整MoE模型的專家數量與參數分布,例如在低性能設備上減少激活參數比例,避免算力瓶頸;

2、分布式訓練框架重構:開源項目DLRover整合多平台框架,結合彈性分布式訓練(EDiT)策略,將訓練時間縮短66.1%,內存佔用降低90%

3、異常處理與存儲優化:通過實時監控系統與自動恢復機制,硬件故障對訓練進度的影響被壓縮至5%以內;同時,利用FUSE技術將I/O效率提升50%,解決了國產芯片集群的存儲瓶頸。

這些創新不僅降低了硬件依賴,更開創了一條“軟硬協同”的技術路線——用算法優化彌補硬件性能差距

這一趨勢已引發連鎖反應,3月26日英偉達股票暴跌5.7%,市值一夜蒸發約1.2萬億元與此相反,據說華為昇騰、阿里平頭哥等國產芯片廠商的訂單量激增。正如科大訊飛與華為合作的昇騰集群案例所示,中國AI產業正從“單點突破”邁向“生態協同”。

因此,此次螞蟻百靈在國產芯片的突破,以及開創性的利用“算法優化彌補硬件不足”的技術路線,表明國產AI廠商開始擺脫對英偉達GPU的絕對依賴,轉向“AMD+國產”混合方案,甚至推動寒武紀、壁仞等廠商的芯片進入主流供應鏈

同時,由於螞蟻百靈成本上的進一步降低,為中小企業和研究機構能以更低成本接入大模型訓練鋪平道路,例如Ling-Lite僅需27.5億激活參數即可達到Llama3.1-8B的水平,大幅降低技術門檻。