亞馬遜雲科技推出新一代AI訓練芯片Amazon Trainium3

2024年12月06日12:22:04 科技 1281

允中 發自 拉斯維加斯

量子位 | 公眾號 QbitAI

亞馬遜雲科技在2024年re:Invent全球大會上宣布了其AI硬件的最新進展——

正式推出基於Amazon Trainium2芯片的Amazon EC2 Trn2實例,同時發佈了新一代AI訓練芯片Trainium3。

這些新產品為人工智能模型的開發和部署提供了更高的性價比和性能,標誌着亞馬遜雲科技在生成式AI領域的新里程碑。

Amazon EC2 Trn2實例採用最新的TrAInium2芯片,性價比較現有基於GPU的EC2實例提升了30-40%,為AI開發者提供了更具成本效益的解決方案。

亞馬遜雲科技推出新一代AI訓練芯片Amazon Trainium3 - 天天要聞

△Amazon EC2 Trn2 實例服務器模塊

每個Trn2實例配備16個Trainium2芯片,可提供高達20.8 Petaflops的浮點算力,非常適合訓練和部署包含數十億參數的大型語言模型。

亞馬遜雲科技推出新一代AI訓練芯片Amazon Trainium3 - 天天要聞

△Amazon Trainium2芯片

為了滿足不斷增長的AI計算需求,亞馬遜還推出了Trn2 UltraServers。

這種服務器機型通過NeuronLink超速互連技術將四個Trn2服務器連接為一個超大型服務器,具備83.2 Petaflops的計算能力,專為超大規模AI模型的訓練和推理而設計。

亞馬遜雲科技推出新一代AI訓練芯片Amazon Trainium3 - 天天要聞

△Amazon EC2 Trn2 UltraServers

此外,亞馬遜雲科技還宣布了新一代AI訓練芯片Trainium3的推出。

這款芯片是亞馬遜首款採用3納米工藝製造的AI芯片,在性能、能效和密度上樹立了新標杆,搭載Trainium3的UltraServers性能預計是Trn2 UltraServers的四倍。

Trainium3的實例預計將在2025年末上線,為未來的大規模生成式AI模型提供更快的訓練速度和更優的實時性能。

亞馬遜雲科技生成式AI產品總監Sherry Marcus博士在交流過程中時表示,亞馬遜致力於為客戶提供更高效的解決方案,幫助他們減少AI幻覺並提高模型的準確性。

Marcus博士提到:

我們推出了自動推理(automated reasoning)等功能,確保大語言模型的輸出更加可靠。這些解決方案使得我們在減少AI幻覺方面取得了很好的效果。

這意味着,Amazon Bedrock平台上可實現基於上下文的驗證機制,以確保模型輸出的合理性和準確性,進一步減少AI幻覺的發生。

除了硬件上的突破,亞馬遜還與多家領先AI公司展開合作。

Anthropic和亞馬遜共同打造了名為Project Rainier的EC2 UltraCluster計算集群,包含數十萬個Trainium2芯片,其算力達到當前最先進AI模型訓練所需算力的五倍以上。

這個項目將成為全球最大的AI計算集群之一,供Anthropic構建和部署未來的AI模型。

Hugging Face也在藉助Amazon Trainium2和Neuron SDK開發開源AI模型,這些合作將使更多開發者能夠以更低的成本、更高的效率創建AI應用。

亞馬遜雲科技還發佈了Amazon Neuron軟件套件,以幫助開發者更好地利用Trainium芯片的性能。

該軟件包含編譯器、運行時庫和工具,與JAX和PyTorch等框架無縫集成,使開發者能夠輕鬆優化模型,在Trainium芯片上實現最佳性能。

Sherry Marcus博士還提到,這些工具的推出將極大地簡化AI模型的開發流程,尤其是在減少AI幻覺和提高模型推理可靠性方面表現突出。

通過推出Amazon Trainium2和Trainium3芯片,亞馬遜雲科技繼續保持在生成式AI硬件領域的領先地位。

新產品不僅能夠為大型模型提供卓越的性能和更快的訓練速度,還顯著降低了企業部署AI的成本。

除此之外,應用層上的更新也是此次re:Invent的一大亮點。

沙利文大中華區總監李慶表示:

本屆re:Invent大會上的新發佈更加側重於產品的實際應用和工具優化,這表明過去一年中,全球用戶正在積極使用亞馬遜雲科技進行生成式AI應用的探索和創新。

本次更新有兩個方面讓李慶印象深刻:一是隨着全球企業對生成式AI的深入應用,數據不僅實現跨區域的傳輸與協同,更實現跨地域、跨區域的深度連接.

二是亞馬遜雲科技進一步優化生成式AI的應用,從數據存儲、治理到管理的全流程提升,旨在簡化 AI 對數據的使用,同時強化模型功能、增加AI agent 管理和應對模型幻覺的功能。

此外,新發佈的 Amazon Nova 大模型家族備受期待,這一系列的模型和亞馬遜雲科技的開放選擇理念將為用戶帶來更多創新機會,進一步推動 AI 的發展。

這些創新將進一步推動生成式AI在各個行業的應用,使企業能夠更好地利用AI技術來提升業務表現、降低運營成本

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

科技分類資訊推薦

零跑全新C11上市,14.98萬起售 - 天天要聞

零跑全新C11上市,14.98萬起售

7月10日,零跑汽車旗下智能越享中型SUV——全新C11正式上市,上市指導價14.98-16.58萬元。零跑C11上市4年來,累計銷量已突破25萬台,是零跑的重要的走量車型,全新C11在造型設計、智能座艙、續航性能、輔助駕駛、駕控體驗及安全基因等六大維度實現全面升級。此次上市的全新C11延續純電與增程雙動力版本,其中,純電車型搭載...
張旭院士:我國類腦智能規模應用潛力巨大 - 天天要聞

張旭院士:我國類腦智能規模應用潛力巨大

7月11日,省加快推進現代化產業體系建設專題會議(人工智能與機械人產業專場)在廣州舉行。現場,來自相關領域的專家學者、企業家、人大代表、研究機構代表踴躍發言,為廣東人工智能與機械人產業的發展積極建言、出謀劃策。中國科學院院士、廣東省智能科學與技術研究院院長張旭表示,類腦智能技術作為新一代智能技術的核心...
【芯片】Tensor G5曝光,Pixel10工程機現身海鮮市場 - 天天要聞

【芯片】Tensor G5曝光,Pixel10工程機現身海鮮市場

近日谷歌Pixel 10 Pro Fold出現在了GeekBench跑分數據庫中:新機搭載了谷歌全新的Tensor G5處理器,據悉這代終於是告別了三星工藝,轉而擁抱台積電N3E工藝。從顯示信息來看,Tensor G5採用了1+5+2的八核CPU架構,1*3.78GHz X4超大核+5*3.05GHz A725大核+2*2.25GHz A520小核構成。單核
【新機】2K屏+潛望長焦,iQOO 15曝光 - 天天要聞

【新機】2K屏+潛望長焦,iQOO 15曝光

說到iQOO的數字旗艦系列,這代iQOO13相機被刀還是挺可惜的,主要也是為了避免和老大哥X200產生衝突。今天@數碼閑聊站曝光了下代iQOO旗艦的信息:新機可能會跳過iQOO 14,直接命名為iQOO 15,這代將會有中杯/大杯兩個杯型。新機將會採用6.85英寸2K LIPO三星定製直面屏,屏幕邊框極窄,支持Pol-less去偏光技術,還具有AR抗眩...
清華專家破百年陳規!滬上論壇曝電力革新,陳磊構想太敢了 - 天天要聞

清華專家破百年陳規!滬上論壇曝電力革新,陳磊構想太敢了

聽說了嗎?清華大學的專家居然說要徹底打破電力系統運行了上百年的規矩!就在上海那場新能源論壇上,陳磊研究員拋出個重磅觀點 —— 以後用電不用再看頻率臉色,有功功率想咋調就咋調!這事兒要是真能成,咱們家裡的空調、電動車充電可就再也不會因為電網不
消費活力釋放,上海零售商業形態向「文商旅體展」融合演進 - 天天要聞

消費活力釋放,上海零售商業形態向「文商旅體展」融合演進

2025年二季度,在上海市政府經濟刺激方案推動下,上海商業市場消費活力逐步釋放,但零售物業租賃指標的復蘇態勢仍顯平緩。核心商圈平均租金為1877元/平方米/月,平均出租率為94.71%,整體表現與去年同期持平,其中徐家匯、陸家嘴等商圈憑藉成熟商業生態,表現相對突出。但與非核心商圈相比,從存量、新增供應、凈吸納量等指...