100萬顆GPU!英偉達與AWS簽下算力大單,2年內交付

芯東西(公眾號:aichip001)

編譯 | 劉煜

編輯 | 陳駿達

芯東西3月20日消息,今天,據路透社最新報道,英偉達AWS亞馬遜雲科技)達成合作,從今年開始,到2027年底以前,英偉達將向AWS出售100萬顆GPU以及包含Spectrum系列網路晶元和Groq晶元在內的多款產品。

英偉達與AWS尚未披露這筆交易的財務細節。

此前,英偉達創始人兼CEO黃仁勛稱,預計英偉達Rubin與Blackwell的兩條產品線的銷售規模將達到1萬億美元(約合人民幣6.89萬億元)。

而本次AWS與英偉達簽訂的合作訂單,正是1萬億美元銷售規模的組成部分。

英偉達加速計算副總裁Ian Buck稱:「推理運算難度極大,極其複雜。想要在推理領域做到頂尖,單靠一款晶元遠遠不夠。我們實際上會用到全部七款晶元。」

AWS計劃將英偉達Groq晶元與該公司另外六款晶元搭配使用,以實現更高效的AI系統為用戶生成答案、執行任務的推理運算過程。

該協議還包括將英偉達Connect X與Spectrum X網路設備部署至AWS的數據中心。

Ian Buck稱:「當然,他們仍會繼續使用自有設備,但我們正展開合作,針對AI領域的關鍵工作負載及頭部客戶,與亞馬遜雲科技共同部署Connect X與Spectrum X設備。」

此舉意義重大,因為AWS的數據中心長期以來一直使用其自主研發、歷經多年打磨的定製化網路設備。

同時,AWS將結合高性能專用網路介面AWS EFA與自研的雲原生AI訓練晶元Trainium,並搭載英偉達用於加速分散式推理場景下的數據傳輸、同時簡化不同硬體之間的傳輸複雜度的NIXL(英偉達推理傳輸庫)技術,進一步提升採用解耦架構的大語言模型的推理速度與互聯效率。

此外,AWS還將利用雲上託管大數據平台AWS EMR與英偉達GPU加速數據分析處理。

英偉達的高效開源大語言模型Nemotron 3 Super模型也即將登陸AWS推出的全託管生成式AI服務平台Bedrock平台,同時擴展該平台對英偉達Nemotron系列模型的支持。

結語:AI基建熱潮持續,英偉達深度綁定下遊客戶

AI的爆火為雲服務商提供了更廣的市場,同時驅使雲服務商加大算力投入。本次亞馬遜雲科技與英偉達達成長期晶元採購協議,旨在為其雲端AI大模型的訓練與推理提供更充足的算力支撐。

此前,英偉達向荷蘭雲服務提供商Nebius投資20億美元,加速Nebius構建行業領先的全棧AI雲平台。英偉達將通過優先提供最新一代加速計算平台,全力支持Nebius在2030年底前建成總容量超過5吉瓦的AI基礎設施。

當前,雲服務商與AI算力領域頭部企業協作,依託高效算力支撐,推動雲服務與數據中心擴建加速落地,持續提升AI大模型的推理效率,為夯實AI基礎設施建設提供助力。