亞馬遜定製3nm AI晶元,2025年底問世

2024年12月04日18:22:04 科技 1487

亞馬遜定製3nm AI晶元,2025年底問世 - 天天要聞

本文由半導體產業縱橫(ID:ICVIEWS)綜合

Trainium3 專為滿足下一代生成式 AI 工作負載的高性能需求而設計。

亞馬遜定製3nm AI晶元,2025年底問世 - 天天要聞

12月3日,亞馬遜旗下AWS CEO Matt Garman宣布,將推出全新 Trainium3,這是自家首款採用3nm製程的晶元,與上代 TrAInium2 相比,計算能力增加2倍,能源效率提升40%,預計2025年底問世。

Matt Garman 指出,Trainium3 專為滿足下一代生成式 AI 工作負載的高性能需求而設計,有助客戶更快地建立更大的模型,並在部署模型時提供卓越的效能,且由 Trainium3 驅動的 UltraServers 預計將比 Trn2 UltraServers 的效能高出四倍。

據Garman透露,目前包括Adobe、AI新創公司Poolside、數據平台服務Databricks以及晶元大廠高通都通過Trainium2處理器訓練其AI模型,其中,高通在雲端計算AI模型後再將其傳送至邊緣端。

此前有報道稱,亞馬遜雲計算部門的高管正在大舉投資定製晶元,希望提高其數十個數據中心的效率,最終降低其自身以及亞馬遜AWS客戶的成本。亞馬遜AWS目標是與英偉達競爭,後者憑藉在AI晶元市場的主導地位,成為全球最有價值的公司之一。

TechInsights分析師G Dan Hutcheson曾表示:「AWS的一大優勢是他們的晶元可以使用更少的電量,他們的數據中心可能可以更高效」,從而降低成本。他說,如果英偉達的圖形處理單元(GPU)是強大的通用工具,那麼亞馬遜可以針對特定任務和服務優化其晶元。

蘋果開始使用亞馬遜的定製人工智慧晶元

蘋果目前使用亞馬遜網路服務的定製人工智慧晶元進行搜索等服務,並將評估該公司的最新人工智慧晶元是否可以用於預訓練其模型,如蘋果智能。

近日,蘋果在一年一度的AWS Reinvent大會上披露了其對亞馬遜專有晶元的使用。蘋果機器學習與人工智慧高級總監Benoit Dupin上台介紹了蘋果是如何使用雲服務的。這是公司正式允許供應商將他們標榜為客戶的罕見例子。

蘋果的Dupin說:「我們有很強的關係,基礎設施既可靠,又能為全球客戶服務。」

蘋果在亞馬遜的會議上亮相,並擁抱該公司的晶元,是在與微軟Azure和谷歌雲爭奪人工智慧支出之際,對雲服務的大力支持。蘋果也使用這些雲服務。

Dupin說,蘋果已經使用AWS服務超過十年了,包括Siri,Apple MapsApple Music。例如,蘋果使用亞馬遜的Inferentia和Graviton晶元來服務搜索服務,Dupin表示亞馬遜晶元提高了40%的效率。

但Dupin也暗示,蘋果將使用亞馬遜的Trainium2晶元對其專有車型進行預訓練。這表明,與英特爾和AMD的x86中央處理器相比,亞馬遜的處理器不僅是一種成本效益高的推理AI模型的方式,而且還可以用於開發新的AI。亞馬遜宣布,其Trainium2晶元一般可供租賃。

Dupin說:「在評估Trainium2的早期階段,我們預計早期人數在預訓練時效率會提高多達50%。」

AWS首席執行官Matt Garman在周二接受CNBC採訪時表示,蘋果一直是該公司Trainium晶元的早期採用者和測試者。

AWS首席執行官馬特·加曼告訴CNBC的凱特·魯尼說:「蘋果來找我們,對我們說,『你們能幫助我們實現生成式人工智慧的能力嗎?我們需要基礎設施來構建』,他們對構建蘋果智能有著這樣的願景。」

今年早些時候,蘋果在一份研究論文中表示,它已經使用谷歌雲TPU晶元來訓練其iPhone人工智慧服務,它稱之為蘋果智能。

大多數人工智慧訓練都是在昂貴的英偉達圖形處理器上完成的。雲提供商和初創公司正在競相開發降低成本的替代方案,並探索可能帶來更高處理效率的不同方法。蘋果使用定製晶元可能向其他公司發出信號,表明非英偉達的培訓方法可以奏效。

預計 AWS 將在周二宣布有關提供基於 Nvidia Blackwell 的 AI 伺服器以供出租的新細節。

今年秋天,蘋果發布了其首個主要生成式人工智慧產品。Apple Intelligence是一系列服務,可以匯總通知、重寫電子郵件和生成新的表情符號。該公司表示,本月晚些時候,它將與OpenAIChatGPT集成,明年,Siri將獲得控制應用程序和自然說話的新能力。

與領先的聊天機器人,如OpenAI的ChatGPT不同,蘋果的人工智慧方法不是基於雲中的大量基於Nvidia的伺服器。相反,蘋果使用iPhone、iPad或Mac晶元來儘可能多地完成處理,然後將複雜的查詢發送給使用其M系列晶元的蘋果操作伺服器。

*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯繫後台。

科技分類資訊推薦

從領先到落後:英特爾正經歷「寒冬」 - 天天要聞

從領先到落後:英特爾正經歷「寒冬」

【環球網科技綜合報道】7月11日,據外媒報道,英特爾首席執行官陳立武近日在發表內部講話時直言英特爾已不再是領先晶元製造商,甚至不在前十。其市值如今僅約1000億美元,與18個月前相比大幅縮水,而英偉達市值卻一度突破4萬億美元,形成鮮明對比。「二三十年前,我們確實是行業領導者。可如今的世界已經變了,我們已不在全...
「中國太酷了」!硬核實力圈粉世界 - 天天要聞

「中國太酷了」!硬核實力圈粉世界

日前舉行的國新辦新聞發布會上,有記者提到,隨著大量海外博主分享來華見聞,「中國變酷了」的印象被越來越多全球網友所認同。對此,國家發展改革委主任鄭柵潔表示,這背後反映了中國的綜合國力。中國變酷了!酷在哪裡?
華為Pura 80 Ultra國際版亮相:系統開機是EMUI 15.0,電池容量為5170mAh - 天天要聞

華為Pura 80 Ultra國際版亮相:系統開機是EMUI 15.0,電池容量為5170mAh

當地時間7月10日,華為在迪拜推出全新的Pura 80 Ultra影像旗艦,售價是5099阿聯酋迪拉姆,約合人民幣9961元。對比國行版,Pura 80 Ultra國際版有兩大變化,一是系統調整為EMUI 15.0,國行版系統是鴻蒙5.1,二是電池容量為5170mAh,國行版電池容量是5700mAh。來源 江南都市報、快科技編輯 賈凱 審核 蔣波 陳潔...
AMD下代桌面銳龍處理器:N2工藝、Zen6架構、更多內核、依舊AM5插槽 - 天天要聞

AMD下代桌面銳龍處理器:N2工藝、Zen6架構、更多內核、依舊AM5插槽

有關於AMD下代桌面端銳龍處理器的更多信息浮出水面。AMD下代桌面端銳龍處理器代號「Medusa Ridge」,將採用全新的Zen6架構,該架構將使用TSMC的N2(2nm)工藝節點構建CCD,相比於前代Zen5架構的台積電N4P工藝節點,N2工藝的晶體管密度將顯著提升。此前單CCD的最大核心數量為8個,而在Medusa Ridge上AMD可能會將單個CCD
AI終結傳統軟體業,如同互聯網終結傳統媒體 - 天天要聞

AI終結傳統軟體業,如同互聯網終結傳統媒體

AI編程工具正推動軟體行業走向「峰值時刻」。近日,晶元金融分析公司Fabricated Knowledge的創始人Doug O'Laughlin發表文章稱,生成式AI正以類似互聯網顛覆傳統媒體的方式,重塑軟體行業的格局。文章指出,AI工具,比如Cursor和Claude Code,正在讓編寫代碼的成本和時間大幅下降,過去需要每token數千美元才能完成的開發
英特爾CEO陳立武坦言:公司已跌出半導體行業前十 - 天天要聞

英特爾CEO陳立武坦言:公司已跌出半導體行業前十

【TechWeb】7月11日消息,據外媒報道,英特爾CEO陳立武在內部講話中坦言,公司已跌出半導體行業前十。陳立武表示,20到30年前,英特爾確實是領導者,世界已經發生了變化。我們現在已經不是排名前十的半導體公司了。有報道稱,英特爾公司發言人後續解釋稱其所指為 "市值" 而非技術。在過去的 18 個月里,英特爾的市值從 202...
華為海思Cat.1物聯晶元Hi2131正式上市 - 天天要聞

華為海思Cat.1物聯晶元Hi2131正式上市

7月10日,華為海思正式宣布,Hi2131 Cat.1物聯晶元正式上市。據介紹,Hi2131 Cat.1 晶元採用超輕量晶元架構與極簡休眠管理,將休眠功耗一舉壓縮至 150uA。相較於常見的同類型晶元,保活功耗直降 30% 以上,數傳功耗亦降低 10%。功耗的顯著優化直接轉化為設備續航能力的躍升。這意味著共享設備維護周期大幅延長,用戶體驗與...