亞馬遜雲科技推出新一代AI訓練芯片Amazon Trainium3

2024年12月06日12:22:04 科技 1281

允中 發自 拉斯維加斯

量子位 | 公眾號 QbitAI

亞馬遜雲科技在2024年re:Invent全球大會上宣布了其AI硬件的最新進展——

正式推出基於Amazon Trainium2芯片的Amazon EC2 Trn2實例,同時發佈了新一代AI訓練芯片Trainium3。

這些新產品為人工智能模型的開發和部署提供了更高的性價比和性能,標誌着亞馬遜雲科技在生成式AI領域的新里程碑。

Amazon EC2 Trn2實例採用最新的TrAInium2芯片,性價比較現有基於GPU的EC2實例提升了30-40%,為AI開發者提供了更具成本效益的解決方案。

亞馬遜雲科技推出新一代AI訓練芯片Amazon Trainium3 - 天天要聞

△Amazon EC2 Trn2 實例服務器模塊

每個Trn2實例配備16個Trainium2芯片,可提供高達20.8 Petaflops的浮點算力,非常適合訓練和部署包含數十億參數的大型語言模型。

亞馬遜雲科技推出新一代AI訓練芯片Amazon Trainium3 - 天天要聞

△Amazon Trainium2芯片

為了滿足不斷增長的AI計算需求,亞馬遜還推出了Trn2 UltraServers。

這種服務器機型通過NeuronLink超速互連技術將四個Trn2服務器連接為一個超大型服務器,具備83.2 Petaflops的計算能力,專為超大規模AI模型的訓練和推理而設計。

亞馬遜雲科技推出新一代AI訓練芯片Amazon Trainium3 - 天天要聞

△Amazon EC2 Trn2 UltraServers

此外,亞馬遜雲科技還宣布了新一代AI訓練芯片Trainium3的推出。

這款芯片是亞馬遜首款採用3納米工藝製造的AI芯片,在性能、能效和密度上樹立了新標杆,搭載Trainium3的UltraServers性能預計是Trn2 UltraServers的四倍。

Trainium3的實例預計將在2025年末上線,為未來的大規模生成式AI模型提供更快的訓練速度和更優的實時性能。

亞馬遜雲科技生成式AI產品總監Sherry Marcus博士在交流過程中時表示,亞馬遜致力於為客戶提供更高效的解決方案,幫助他們減少AI幻覺並提高模型的準確性。

Marcus博士提到:

我們推出了自動推理(automated reasoning)等功能,確保大語言模型的輸出更加可靠。這些解決方案使得我們在減少AI幻覺方面取得了很好的效果。

這意味着,Amazon Bedrock平台上可實現基於上下文的驗證機制,以確保模型輸出的合理性和準確性,進一步減少AI幻覺的發生。

除了硬件上的突破,亞馬遜還與多家領先AI公司展開合作。

Anthropic和亞馬遜共同打造了名為Project Rainier的EC2 UltraCluster計算集群,包含數十萬個Trainium2芯片,其算力達到當前最先進AI模型訓練所需算力的五倍以上。

這個項目將成為全球最大的AI計算集群之一,供Anthropic構建和部署未來的AI模型。

Hugging Face也在藉助Amazon Trainium2和Neuron SDK開發開源AI模型,這些合作將使更多開發者能夠以更低的成本、更高的效率創建AI應用。

亞馬遜雲科技還發佈了Amazon Neuron軟件套件,以幫助開發者更好地利用Trainium芯片的性能。

該軟件包含編譯器、運行時庫和工具,與JAX和PyTorch等框架無縫集成,使開發者能夠輕鬆優化模型,在Trainium芯片上實現最佳性能。

Sherry Marcus博士還提到,這些工具的推出將極大地簡化AI模型的開發流程,尤其是在減少AI幻覺和提高模型推理可靠性方面表現突出。

通過推出Amazon Trainium2和Trainium3芯片,亞馬遜雲科技繼續保持在生成式AI硬件領域的領先地位。

新產品不僅能夠為大型模型提供卓越的性能和更快的訓練速度,還顯著降低了企業部署AI的成本。

除此之外,應用層上的更新也是此次re:Invent的一大亮點。

沙利文大中華區總監李慶表示:

本屆re:Invent大會上的新發佈更加側重於產品的實際應用和工具優化,這表明過去一年中,全球用戶正在積極使用亞馬遜雲科技進行生成式AI應用的探索和創新。

本次更新有兩個方面讓李慶印象深刻:一是隨着全球企業對生成式AI的深入應用,數據不僅實現跨區域的傳輸與協同,更實現跨地域、跨區域的深度連接.

二是亞馬遜雲科技進一步優化生成式AI的應用,從數據存儲、治理到管理的全流程提升,旨在簡化 AI 對數據的使用,同時強化模型功能、增加AI agent 管理和應對模型幻覺的功能。

此外,新發佈的 Amazon Nova 大模型家族備受期待,這一系列的模型和亞馬遜雲科技的開放選擇理念將為用戶帶來更多創新機會,進一步推動 AI 的發展。

這些創新將進一步推動生成式AI在各個行業的應用,使企業能夠更好地利用AI技術來提升業務表現、降低運營成本

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

科技分類資訊推薦

雷軍,職務調整! - 天天要聞

雷軍,職務調整!

5月5日,雷軍職務調整衝上微博熱搜。天眼查顯示,近日,小米之家商業有限公司發生工商變更,雷軍由執行董事改任董事,同時經營範圍新增智能家庭消費設備銷售、美髮飾品銷售。
雷軍2025年遭老罪了!卸任董事又遇車禍,小米這回還能挺住不? - 天天要聞

雷軍2025年遭老罪了!卸任董事又遇車禍,小米這回還能挺住不?

2025年5月,小米之家工商信息悄摸兒變了——雷軍的職務從「執行董事」改成「董事」。就這倆字的變動,跟往輿論鍋里扔了顆炸彈似的,炸出一堆問號:雷總這是要放權了?小米是不是出啥大事兒了?咱今兒就掰開揉碎了,聊聊雷軍今年有多難,順便看看小米這船
個人視頻被搬運上熱搜閱讀過億,「潑天的流量」令創作者害怕:不想被身邊人看到 - 天天要聞

個人視頻被搬運上熱搜閱讀過億,「潑天的流量」令創作者害怕:不想被身邊人看到

近日,短視頻創作者「大福在成長」發佈自己失業後生活的視頻被搬運至其他平台,不僅上了熱搜,話題量還破億。「潑天的流量」卻並未讓她開心,因為自己本人並未授權,同時個人隱私還被「廣而告之」,她私信要求對方刪除卻未被理睬。近日,創作者向揚子晚報/紫牛新聞記者講述了自己艱難的維權過程。2024年11月份,博主「大福...
蘋果推出 2025 彩虹系列Apple Watch錶帶 - 天天要聞

蘋果推出 2025 彩虹系列Apple Watch錶帶

IT之家 5 月 5 日消息,蘋果今日推出新款 Apple Watch 彩虹版運動型錶帶、錶盤和 iPhone 與 iPad 牆紙。彩虹版運動型錶帶即日起接受訂購,配套的動態錶盤與牆紙近日將隨軟件更新發佈。每一條彩虹版運動型錶帶都由手工裝配而成,壓模成型的鮮艷條紋構成形狀大小不一的彩虹條狀圖案,呈現含蓄而又驚艷的多變效果。蘋果稱每一...
華生科技2024年財報亮眼,營收利潤雙增長,但研發項目延期引關注 - 天天要聞

華生科技2024年財報亮眼,營收利潤雙增長,但研發項目延期引關注

5月4日,華生科技發佈2024年年報,公司實現營業收入3.52億元,同比增長46.94%;歸屬凈利潤4942.30萬元,同比增長77.91%。儘管業績顯著改善,但研發中心建設項目延期至2025年6月,引發市場對其執行力的質疑。一、業績大幅回升,但仍未恢復至歷史高點2024年,華生科技的營業收入和凈利潤均實現大幅增長,分別達到3.52億元和4...