it之家 4 月 10 日消息,在今日舉行的華為雲生態大會 2025 上,華為常務董事、華為雲計算 ceo 張平安公布了 ai 基礎設施架構進展,推出 cloudmatrix 384 超節點,並宣布已在蕪湖數據中心規模上線。
據介紹,華為雲 cloudmatrix 384 超節點可實現從服務器級到矩陣級的資源供給模式轉變,具備「高密」「高速」「高效」的特點,通過架構創新,在算力、互聯帶寬、內存帶寬等方面實現領先。
華為雲還表示,對昇騰 ai 雲服務進行持續優化,目前其已全面適配包含 deepseek 在內的 160 多個第三方大模型,為大模型訓推提供可靠保障,支撐行業應用快速落地。此外,華為雲盤古大模型已在 30 多個行業、400 多個場景中落地,在城市治理、智慧金融、醫療健康、氣象預測等領域廣泛應用。
it之家注意到,硅基流動今日也宣布聯合華為雲基於 cloudmatrix 384 超節點昇騰雲服務和高性能推理框架 siliconllm ,用大規模專家並行最佳實踐正式上線 deepseek-r1。
硅基流動介紹稱,該服務在保證單用戶 20 tps 水平前提下,單卡 decode 吞吐突破 1920 tokens / s,可比肩 h100 部署性能。同時,經過主流測試集驗證及大規模線上盲測,在昇騰算力部署 deepseek-r1 的模型精度與 deepseek 官方保持一致。