2022 LS30 | 淺談英特爾Habana Gaudi 2加速器技術領先性

2022年12月18日10:16:10 科技 1273

ZAO 2022中關村在線年度觀察推選年度領先解決方案Leading Solutions 30(以下簡稱LS30),為行業用戶提供更好的選擇,助力行業優質解決方案與技術方案。

中關村在線認為,2022年英特爾推出的Habana Gaudi 2處理器可以參與本次終極評選。Habana Gaudi 2處理器採用了7納米製程工藝,以Habana的高能效架構為基礎,面向數據中心的計算機視覺和自然語言應用,旨在為客戶的模型訓練和推理提供更高的性能。

2022 LS30 | 淺談英特爾Habana Gaudi 2加速器技術領先性 - 天天要聞

對數據中心的意義:助力實現高效AI訓練

現如今,人工智能正從技術概念走向千行百業,實現多場景的實際落地,可以看到的是,人工智能熱潮正推動AI芯片市場不斷煥新。據Allied Market Research報告,全球機器學習芯片市場規模到2025年將達到約378億美元。這不僅驅動着傳統芯片公司戰略和技術的轉型,也推動了大量新玩家入局,在延續性或顛覆性創新方面頻出奇招。

今年英特爾推出的用於高性能深度學習AI訓練的Gaudi處理器,能夠讓客戶以較低成本進行更多訓練。最新發布的Habana Gaudi2是基於Synapse AI軟件棧開發的,能夠通過支持多樣化架構,讓終端用戶充分利用處理器的高性能和高能效。

對於數據中心而言,由於數據集和人工智能業務的規模和複雜性日益增長,訓練深度學習模型所需的時間和成本越來越高,根據IDC的數據,在2020年接受調查的機器學習從業者中,有74%的人對其模型進行過5-10次迭代訓練,超過50%需要每周或更頻繁地重建模型,26%的人則每天甚至每小時會重建模型。56%的受訪者認為培訓成本是阻礙其組織利用人工智能解決問題,創新和增強終端客戶體驗的首要因素。英特爾推出的Habana Gaudi 2處理器採用了7納米製程工藝,並以Habana的高能效架構為基礎,面向數據中心的計算機視覺和自然語言應用,旨在為客戶的模型訓練和推理提供更高的性能。

技術解析:全方位升級有效提高訓練性能

基於與第一代Gaudi相同的體系架構,Habana Gaudi 2處理器大幅提高了訓練性能。客戶在雲端運行Amazon EC2 DL1實例以及本地運行Supermicro Gaudi訓練服務器時,其性價比比現有GPU解決方案提升了40%,這些都來自於Gaudi2在架構上的進步:包括製程工藝從16納米躍升至7納米;在矩陣乘法(MME)和Tensor處理器核心計算引擎中引入了FP8在內的新數據類型;Tensor處理器的核心數量由8個增至24個;芯片上集成多媒體處理引擎,實現從主機子系統的卸載;片內封裝的內存容量提升了3倍,從32GB提升到帶寬2.45TB/秒的96GB HBM2E;兩倍48MB的板載SRAM存儲器以及基於RDMA (RoCE2) 的集成以太網從10個增至24個,在標準網絡上實現高效的縱向和橫向擴展。

2022 LS30 | 淺談英特爾Habana Gaudi 2加速器技術領先性 - 天天要聞

從MLPerf行業測試中的表現也可以看出來,Habana Gaudi 2處理器在視覺(ResNet-50)和語言(BERT)模型上相比NVIDIA A100訓練時間上擁有不小的優勢。

相比於第一代Gaudi處理器,Habana Gaudi 2處理器在ResNet-50模型的訓練吞吐量提高了3倍,BERT模型的訓練吞吐量提高了4.7倍。這些歸因於製程工藝從16納米提升至7納米、Tensor處理器內核數量增加了三倍、增加GEMM引擎算力、封裝的高帶寬存儲容量提升了三倍、SRAM帶寬提升以及容量增加一倍。對於視覺處理模型的訓練,Gaudi2處理器集成了媒體處理引擎,能夠獨立完成包括AI訓練所需的數據增強和壓縮圖像的預處理。

兩代Gaudi處理器的性能都是在沒有特殊軟件操作的情況下通過Habana客戶開箱即用的商業軟件棧實現的。

通過商用軟件所提供的開箱即用性能,在Habana 8個GPU服務器與HLS-Gaudi2參考服務器上進行測試比對。其中,訓練吞吐量來自於NGC和Habana公共庫的TensorFlow docker,採用雙方推薦的最佳性能參數在混合精度訓練模式下進行測量。值得注意的是,吞吐量是影響最終訓練時間收斂的關鍵因素。

2022 LS30 | 淺談英特爾Habana Gaudi 2加速器技術領先性 - 天天要聞2022 LS30 | 淺談英特爾Habana Gaudi 2加速器技術領先性 - 天天要聞

●行業影響和用戶需求:數據中心按需加速,讓深度學習更“快”

通過將Habana Gaudi 2部署到數據中心,可針對計算機視覺與自然語言處理的模型訓練與推理提供更高效能,並解決客戶最關注的兩個問題:降低服務器處理成本,還能減少訓練模型所需時間。Habana Gaudi2和Greco AI加速器是基於Synapse AI軟件棧開發的,能夠通過支持多樣化架構,讓終端用戶充分利用處理器的高性能和高能效。

同時,藉助Habana Labs的Gaudi平台,數據中心團隊能夠專註於深度學習處理器技術,讓數據科學家和機器學習工程師得以高效地進行模型訓練,並通過簡單的代碼實現新模型構建或現有模型遷移,提高工作效率的同時降低運營成本

●結語

針對主要為雲計算邊緣計算等需求提供算力的“基礎算力”領域,英特爾發布的第二代Gaudi處理器Habana Gaudi2,在深度學習上實現了重點飛躍,能夠通過支持多樣化架構,讓用戶充分利用處理器的高性能和高能效,以更高的性價比訓練數據中心負載。毫無疑問的是,在服務器或服務器集群主要用於深度學習訓練和推理計算的場景中,Habana Gaudi2是理想的加速器,針對這些專用場景,它能夠提供優異的深度學習性能並降低總體擁有成本。

(8086572)

科技分類資訊推薦

iOS 26 代碼顯示:蘋果地圖將新增自然語言搜索和過熱保護功能 - 天天要聞

iOS 26 代碼顯示:蘋果地圖將新增自然語言搜索和過熱保護功能

IT之家 7 月 8 日消息,@Steve Moser 今天在 X 上發帖,分享了他在 iOS 26 測試版代碼字符串中發現的兩項 Apple Maps 新功能,且這兩項功能此前均未官宣。iOS 26 開發者測試版代碼證實,Apple Maps 將新增兩項功能:自然語言搜索:功能描述:用說話的方式進行搜索(Search the Way You Talk)支持
三星 Galaxy Watch8 / Classic 智能手錶新宣傳圖曝光:方圓設計 - 天天要聞

三星 Galaxy Watch8 / Classic 智能手錶新宣傳圖曝光:方圓設計

IT之家 7 月 8 日消息,消息源 Roland Quandt 今天(7 月 8 日)在 Bluesky 平台上發布動態,分享了三星 Galaxy Watch8 和 Galaxy Watch8 Classic 兩款智能手錶的宣傳圖。和此前曝光的渲染圖相似,本次曝光的宣傳圖中,三星 Galaxy Watch8 和 Galaxy Watch8 Classic
蘋果 Masimo 再次就 Apple Watch 進口禁令對簿公堂 - 天天要聞

蘋果 Masimo 再次就 Apple Watch 進口禁令對簿公堂

IT之家 7 月 8 日消息,路透社今日報道稱,蘋果公司當地時間周一於美國聯邦巡迴上訴法院就 Apple Watch 進口禁令提出上訴,要求推翻美國國際貿易委員會(ITC)2023 年底作出的裁決。上述裁決認定蘋果侵犯了醫療科技公司 Masimo 血氧監測相關專利,禁止 Apple Watch Series 9 及 Ultra 2 型號在美銷售。本案結果將決
首超 Win10,微軟 Win11 成為全球第一大桌面操作系統 - 天天要聞

首超 Win10,微軟 Win11 成為全球第一大桌面操作系統

IT之家 7 月 8 日消息,statcounter 數據顯示,2025 年 7 月,微軟 Windows 11 系統首次超越 Windows 10,成為全球範圍內第一大 Windows 操作系統。Windows 11 在 Windows 中的份額佔比達到 52%,Windows 10 降到了 44.59%。IT之家查詢發現,從全球桌面操作系統整體來看,Wi
蘋果聯合哥倫比亞大學開發AI系統SceneScout,為盲人解鎖街景導航 - 天天要聞

蘋果聯合哥倫比亞大學開發AI系統SceneScout,為盲人解鎖街景導航

IT之家 7 月 8 日消息,蘋果與哥倫比亞大學的研究團隊開發出了一項名為 SceneScout 的 AI 原型系統,旨在為盲人及低視力群體(BLV)提供街景導航輔助。該系統結合蘋果地圖(Apple Maps)API 與多模態大語言模型(基於 GPT-4o 內核),生成定製化環境描述。IT之家注意到,相關論文已經發表在預印平台 arXiv 上(未經同行評審.
國網山西電力智能決策功能上線 - 天天要聞

國網山西電力智能決策功能上線

本報訊 為提升電力市場交易透明度,幫助企業更精準地管理用電成本,7月7日,國網山西省電力公司發布消息,該公司在“e-交易”App上線“零售客戶月度賬單展示分析”智能決策功能,為全省工商業企業用電管理提供有力支撐。  據了解,“零售客戶”是指
山西數據流量谷AI應用服務平台示範效應顯現 - 天天要聞

山西數據流量谷AI應用服務平台示範效應顯現

本報訊 7月7日消息,在省委網信辦聯合14家省直及中央駐晉單位主辦的“山西省2025年全民數字素養與技能提升月活動”中,山西數據流量谷AI應用服務平台及數字化展廳入選“人工智能賦能千行百業典型案例”與“全省數字體驗館”雙榜單。
蘋果 macOS 26 開發者預覽版 Beta 3 發布 - 天天要聞

蘋果 macOS 26 開發者預覽版 Beta 3 發布

IT之家 7 月 8 日消息,蘋果今日向 Mac 電腦用戶推送了 macOS 26 開發者預覽版 Beta 3 更新(內部版本號:25A5306g),本次更新距離上次發布 Beta/RC 間隔 14 天。 本文由機器人發布,IT之家稍後將為大家帶來具體更新內容。 附 macOS 26 發布歷史: IT之家小夥伴如果找到更多新內容,可以在投稿或評論區中提出你的