1/5工程師跑路!微軟AI晶元難產,或將推遲至2026年量產

劃重點:

  1. 微軟新一代maia ai晶元的量產時間將從2025年推遲至2026年。

  2. 延期的主要原因包括晶元設計變化、研發團隊人手不足以及員工流動性過高。

  3. 微軟的ai晶元在能效方面將難以與英偉達同類產品競爭。

微軟已花費多年時間設計自家的人工智慧晶元,部分原因是希望減少對英偉達的依賴。然而,這一計劃的進展並不順利。

微軟ai晶元延期 存在三大致命硬傷

按照年收入計算,微軟是英偉達最大的客戶之一,但其最新一代ai晶元的設計進展遠遠落後於預期。這意味著,當這些晶元投入量產時,可能會遠遠落後於英偉達的同類產品,缺乏足夠的競爭力。 

微軟面臨的困境凸顯了一個問題:隨著ai技術的飛速發展,企業在開發專用ai晶元時,面臨的挑戰愈發嚴峻。而英偉達的通用處理器以其卓越的性能主導著整個行業。 

晶元開發通常需要至少兩年的時間,但隨著ai領域的快速突破,專用ai晶元需要應對不斷變化的技術需求,面臨著隨時過時的風險,特別是在ai模型的構建和運行方式發生重大變化時。

據知情人士透露,微軟的下一代ai晶元代號為braga,計劃推遲至少六個月才能進入量產。這意味著,量產時間將從2025年推遲至2026年。即使braga晶元投產,預計其性能也將遠遜於英偉達的旗艦晶元blackwell,後者在2024年底發布。 

微軟原計劃今年將braga晶元部署到其數據中心。但項目負責人表示,braga晶元的推遲主要由於設計發生預料之外的變化、研發團隊人員不足以及員工流動性過高等因素。微軟發言人拒絕對此發表評論。 

微軟ai路線圖:三年發三款推理晶元

微軟從2019年開始開發其首款ai晶元,並於2023年發布了maia 100晶元。當時,微軟將maia 100宣傳為「顛覆性」產品,稱其能夠支持copilot等ai助手和chatgpt等ai服務。openai首席執行官山姆·奧特曼(sam altman)也高度評價了這款晶元,表示它為訓練更多模型、降低運行成本打開了大門。

然而,實際情況卻並非如此。微軟主要將maia 100用於內部測試,而非實際生產環境。根據多位在職及離職的微軟員工透露,maia 100並未為微軟的任何ai服務提供支持,主要原因是該晶元最初於2019年設計,正好發生在openai發布chatgpt之前,其設計重點是圖像處理,而非生成式ai。

在2024年maia 100發布後,微軟啟動了一個雄心勃勃的計劃,計劃在2025年、2026年和2027年分別發布三款後續晶元,代號分別為braga、braga-r和clea,並將它們部署到數據中心。然而,braga晶元推遲至2026年,這引發了人們對微軟是否能夠按時推出剩餘兩款晶元的擔憂。

據三位微軟晶元團隊成員透露,這三款晶元均為推理晶元,主要用於將訓練好的模型應用到新數據上,以生成回應或做出決策。微軟原計劃設計一款用於訓練ai模型的晶元,但在2024年初取消了這一計劃。 

在braga晶元開發的過程中,微軟要求對其設計進行更改,以滿足openai提出的新功能需求。這使得晶元在模擬測試中變得不穩定,工程師不得不花費幾個月時間來解決問題。

儘管braga晶元的設計經歷了重大變化,但微軟高層依然堅持要求在年底前完成設計。這一最後期限給晶元團隊帶來了極大的壓力,導致有五分之一的團隊成員離開了項目。多位參與者表示,微軟的晶元團隊人員流動性較高。

據知情人士透露,微軟的ai晶元在至少maia 300(代號clea)問世之前,將難以與英偉達的產品競爭。clea將採用全新設計,與braga相比,其性能將大幅提升。但在此之前,maia系列晶元的電力消耗較高,性能也大幅落後於英偉達的同類產品。 

針對日益增多的競爭性自主晶元項目,英偉達也做出了回應。據參與該項目的人員透露,英偉達為了使客戶難以用其它晶元替代其產品,已為其旗艦ai硬體系統gb200設定了極為激進的性能目標。

微軟/谷歌/亞馬遜集體造芯 卻還是干不過英偉達!

微軟並不是唯一一家計劃開發自家ai晶元的大型科技公司。亞馬遜也在研發其第三代ai晶元——trainium 3,預計將在今年年底前交付客戶。亞馬遜發言人表示,項目進展順利,trainium 3將提供比前一代trainium 2高出兩倍的計算能力。

與此同時,谷歌已經花費約十年時間自研ai晶元,稱為tpu(張量處理單元)。因此,谷歌無需依賴英偉達的晶元來訓練或運行大多數ai模型。據知情人士透露,谷歌的下一代tpu晶元代號為ironwood,預計將在今年底開始小規模生產,並於明年大規模量產。

不過,谷歌依然是英偉達的重要客戶,因為它租賃搭載英偉達晶元的伺服器供雲計算客戶使用,同時也使用英偉達晶元來支持一些不適合由谷歌tpu處理的ai服務。

谷歌也面臨著其他問題。去年,谷歌與聯發科合作設計下一代tpu晶元,但該合作遭遇了挫折。負責tpu網路技術的聯發科核心團隊多位成員離職,轉而加入英偉達。這項技術對於ai至關重要,因為它能讓多個晶元協同工作。

英偉達ceo黃仁勛6月初在開發者大會上表示,大多數大型科技公司正在推進的競爭性晶元項目最終會被放棄。他還質問道:「如果你做的asic(特定應用集成電路)不比現有的更好,那還有什麼意義?」 (騰訊科技特約編譯 金鹿)