本文由半導體產業縱橫(ID:ICVIEWS)綜合
Trainium3 專為滿足下一代生成式 AI 工作負載的高性能需求而設計。
12月3日,亞馬遜旗下AWS CEO Matt Garman宣布,將推出全新 Trainium3,這是自家首款採用3nm製程的晶元,與上代 TrAInium2 相比,計算能力增加2倍,能源效率提升40%,預計2025年底問世。
Matt Garman 指出,Trainium3 專為滿足下一代生成式 AI 工作負載的高性能需求而設計,有助客戶更快地建立更大的模型,並在部署模型時提供卓越的效能,且由 Trainium3 驅動的 UltraServers 預計將比 Trn2 UltraServers 的效能高出四倍。
據Garman透露,目前包括Adobe、AI新創公司Poolside、數據平台服務Databricks以及晶元大廠高通都通過Trainium2處理器訓練其AI模型,其中,高通在雲端計算AI模型後再將其傳送至邊緣端。
此前有報道稱,亞馬遜雲計算部門的高管正在大舉投資定製晶元,希望提高其數十個數據中心的效率,最終降低其自身以及亞馬遜AWS客戶的成本。亞馬遜AWS目標是與英偉達競爭,後者憑藉在AI晶元市場的主導地位,成為全球最有價值的公司之一。
TechInsights分析師G Dan Hutcheson曾表示:「AWS的一大優勢是他們的晶元可以使用更少的電量,他們的數據中心可能可以更高效」,從而降低成本。他說,如果英偉達的圖形處理單元(GPU)是強大的通用工具,那麼亞馬遜可以針對特定任務和服務優化其晶元。
蘋果開始使用亞馬遜的定製人工智慧晶元
蘋果目前使用亞馬遜網路服務的定製人工智慧晶元進行搜索等服務,並將評估該公司的最新人工智慧晶元是否可以用於預訓練其模型,如蘋果智能。
近日,蘋果在一年一度的AWS Reinvent大會上披露了其對亞馬遜專有晶元的使用。蘋果機器學習與人工智慧高級總監Benoit Dupin上台介紹了蘋果是如何使用雲服務的。這是公司正式允許供應商將他們標榜為客戶的罕見例子。
蘋果的Dupin說:「我們有很強的關係,基礎設施既可靠,又能為全球客戶服務。」
蘋果在亞馬遜的會議上亮相,並擁抱該公司的晶元,是在與微軟Azure和谷歌雲爭奪人工智慧支出之際,對雲服務的大力支持。蘋果也使用這些雲服務。
Dupin說,蘋果已經使用AWS服務超過十年了,包括Siri,Apple Maps和Apple Music。例如,蘋果使用亞馬遜的Inferentia和Graviton晶元來服務搜索服務,Dupin表示亞馬遜晶元提高了40%的效率。
但Dupin也暗示,蘋果將使用亞馬遜的Trainium2晶元對其專有車型進行預訓練。這表明,與英特爾和AMD的x86中央處理器相比,亞馬遜的處理器不僅是一種成本效益高的推理AI模型的方式,而且還可以用於開發新的AI。亞馬遜宣布,其Trainium2晶元一般可供租賃。
Dupin說:「在評估Trainium2的早期階段,我們預計早期人數在預訓練時效率會提高多達50%。」
AWS首席執行官Matt Garman在周二接受CNBC採訪時表示,蘋果一直是該公司Trainium晶元的早期採用者和測試者。
AWS首席執行官馬特·加曼告訴CNBC的凱特·魯尼說:「蘋果來找我們,對我們說,『你們能幫助我們實現生成式人工智慧的能力嗎?我們需要基礎設施來構建』,他們對構建蘋果智能有著這樣的願景。」
今年早些時候,蘋果在一份研究論文中表示,它已經使用谷歌雲TPU晶元來訓練其iPhone人工智慧服務,它稱之為蘋果智能。
大多數人工智慧訓練都是在昂貴的英偉達圖形處理器上完成的。雲提供商和初創公司正在競相開發降低成本的替代方案,並探索可能帶來更高處理效率的不同方法。蘋果使用定製晶元可能向其他公司發出信號,表明非英偉達的培訓方法可以奏效。
預計 AWS 將在周二宣布有關提供基於 Nvidia Blackwell 的 AI 伺服器以供出租的新細節。
今年秋天,蘋果發布了其首個主要生成式人工智慧產品。Apple Intelligence是一系列服務,可以匯總通知、重寫電子郵件和生成新的表情符號。該公司表示,本月晚些時候,它將與OpenAI的ChatGPT集成,明年,Siri將獲得控制應用程序和自然說話的新能力。
與領先的聊天機器人,如OpenAI的ChatGPT不同,蘋果的人工智慧方法不是基於雲中的大量基於Nvidia的伺服器。相反,蘋果使用iPhone、iPad或Mac晶元來儘可能多地完成處理,然後將複雜的查詢發送給使用其M系列晶元的蘋果操作伺服器。
*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯繫後台。