AMD發佈自己最強AI芯片:性能碾壓H100,國內應該無法引入

2023年12月07日12:43:08 科技 1894

在AI芯片這部分,NVIDIA是目前全球範圍內毫無爭議的老大,不但出貨量最高,同時性能部分也是最強的,幾乎全球所有大型AI模型都採用了NVIDIA的AI芯片來提供算力。而在近日,AMD舉行了「Advancing AI」發佈會,正式推出了面向AI及HPC領域的GPU產品Instinct MI300A/MI300X加速器,直接與NVIDIA之前最強的AI芯片H100競爭。

AMD發佈自己最強AI芯片:性能碾壓H100,國內應該無法引入 - 天天要聞

事實上,AMD在今年六月就紙面發佈MI300A和MI300X,現在MI300A和MI300X已經開始批量量產了,所以在這次發佈會上AMD也公布了更多關於MI300A、MI300X的性能數據。AMD MI300A採用了Chiplet設計,其內部擁有多達13個小芯片,基於台積電5nm或6nm製程工藝CPU/GPU計算核心為5nm,HBM內存和I/O等為6nm),其中許多是3D堆疊的,以便創建一個面積可控的單芯片封裝,總共集成1460 億個晶體管

MI300A採用新一代的CDNA 3 GPU架構,擁有228個計算單元(14592個核心),並集成了24個Zen 4 CPU內核,配置了128GB的HBM3內存。MI300A的計算核心被8個HBM3內存包圍,單個HBM3的帶寬為6.3GB/s,八個16GB堆棧形成128GB統一內存,帶寬高達5.3 TB/s。 MI300A提供了高達61 TFLOPS FP64算力,多達122 TFLOPS FP32算力。

AMD發佈自己最強AI芯片:性能碾壓H100,國內應該無法引入 - 天天要聞

至於MI300X,內部集成了12個5/6nm工藝的小芯片(HMB和I/O為6nm),擁有1530億個晶體管,採用了更多計算核心的CDNA 3 GPU。MI300X的每個基於CDNA 3 GPU架構的GCD總共有40個計算單元,相當於2560個內核。總共有八個計算芯片(GCD),因此總共有320個計算和20480個核心單元。不過,就目前的量產版而言,會稍微有一些縮水。

在內存帶寬方面,MI300X也配備了更大的 192GB HBM3內存,帶來高達5.2TB/s的帶寬和896GB/s的Infinity Fabric帶寬。大型內存池在LLM(大語言模型)中非常重要,LLM大多是與內存綁定的,AMD可以通過在HBM內存容量上的領先地位來提升人工智能能力。

AMD發佈自己最強AI芯片:性能碾壓H100,國內應該無法引入 - 天天要聞

具體來看性能提升,MI300A APU提供了相比H100高達4倍的性能提升,與NVIDIA的Grace Hopper超級芯片相比,該系統每瓦的性能也提高了2倍。而更像純粹GPU架構的MI300X,在具體的AI大模型加速性能對比當中,相比H100在 FlashAttention-2 和 Llama 2 70B 中提供了高達 20% 的性能提升。在各種整數和浮點性能上,MI300X都是H100的1.3倍,這的確相當讓人震驚。

AMD之前內部估計全球數據中心AI加速器市場在2023年的規模可達約300億美元,今後每年的複合增長率都能超過50%,到2027年將形成超過1500億美元的價值。而現在AMD已經將2023年、2027年的數據中心AI加速器市場規模預期分別調高到400億美元、4500億美元,年複合增長率超過70%。

AMD發佈自己最強AI芯片:性能碾壓H100,國內應該無法引入 - 天天要聞

從目前來看,針對AI市場,AMD拿出了比NVIDIA更全面的方案,MI300A作為一個APU方案,實際上解決了很多廠商的問題,終端廠商只要採購MI300A就能自己推出OEM的AI PC;而在純GPU方案上,MI300X現在也要強於H100不少,目前AMD要做的就是完善自己的生態,從而讓更多廠商選擇自己的芯片。當然無論是MI300A還是MI300X,其算力早就超過了美國出口管制的底線,所以這兩款芯片大概率是沒法在國內銷售的。在美國商務部點名NVIDIA之後,AMD可能不會針對國內市場推出特供版。

科技分類資訊推薦

618商家動員啟動 紅利電商平台發佈經營方法論 - 天天要聞

618商家動員啟動 紅利電商平台發佈經營方法論

封面新聞記者 蔡世奇 吳雨佳5月9日,得物在杭州舉行的「Young新品主場」商家大會上,首次發佈品牌經營方法論,為品牌商家明確提出從新品冷啟動到打爆,再到全生命周期穩定長銷的有效增長路徑。
從智造到智行,北京科博會解碼智慧出行全鏈條創新 - 天天要聞

從智造到智行,北京科博會解碼智慧出行全鏈條創新

第二十七屆中國北京國際科技產業博覽會(簡稱「北京科博會」)釋放「新未來」信號,是創新技術的競技場。新京報貝殼財經記者探訪北京科博會現場發現,從車聯網、智能網聯到賦能整車,再到氫能、鈉離子電池等新能源技術的突破,從智造到智行,北京科博會正在上演智慧出行與綠色未來的變革。智慧巡查車自動化檢測只需10秒在北...
機械人、無人車、修文物,北京市職教社攜院校企業首次亮相科博會 - 天天要聞

機械人、無人車、修文物,北京市職教社攜院校企業首次亮相科博會

第二十七屆中國北京國際科技產業博覽會正在舉辦,5月9日,北京市中華職業教育社首次以組團形式亮相科博會,組織北京科技職業大學、北京交通運輸職業學院、學大教育等6家院校及企業參展。聚焦「科技引領 職教新行」主題,通過實物展示、圖文介紹、現場體驗三種模式進行展示,涵蓋機械人、無人車、文物修復等多個領域,展現職...
阿維塔公布風阻係數測試結果:120kph測試風速下風阻係數Cd:0.217 - 天天要聞

阿維塔公布風阻係數測試結果:120kph測試風速下風阻係數Cd:0.217

近日,有博主發佈視頻稱,某國產電車(阿維塔12)風阻係數「屢破紀錄」,但實測發現「和20年前燃油車水平一樣」。該博主表示,阿維塔12測出風阻係數為0.28cd,遠高於此前阿維塔宣稱的0.21cd。對此,阿維塔曾多次發文回應,稱該消息不實,並表示將公開測試。5月9日晚,阿維塔官微公布風阻係數測試結果。「中國汽研權威機構實...
研發投入超過凈利潤2.5倍 科創板「含科量」持續上升 - 天天要聞

研發投入超過凈利潤2.5倍 科創板「含科量」持續上升

圖片來源:視覺中國隨着年報收官,科創板「含科量」亦浮出水面。根據上交所統計,科創板全年研發投入總額達到1680.78億元,超過凈利潤2.5倍,同比增長6.4%,最近3年複合增速達10.7%。值得一提的是,科創板未盈利企業積極發揮科技創新主體作用,持續加大研發投入力度,帶動自主創新能力不斷提升。「含科量」不斷增強2024年,...
數毛社:《GTA6》主機可能鎖30幀 - 天天要聞

數毛社:《GTA6》主機可能鎖30幀

Rockstar Games近日發佈的《GTA6》第二支預告展示了令人驚嘆的畫面細節和複雜的開放世界,但技術專家根據對預告片的分析預測,遊戲在主機上的運行幀率可能無法達到60FPS。Digital Foundry的專家分析,有跡象表明,《GTA6》在發售時很可能將以30幀/秒(FPS)運行,至少在主機平台上是如此。Digital Foundry團隊指出,在分
用過一次免密支付後商家可隨時扣款?微信、支付寶緊急回應 - 天天要聞

用過一次免密支付後商家可隨時扣款?微信、支付寶緊急回應

今天,「自動扣款」相關話題登上熱搜。有網友發帖稱開通某個商家或APP的「先用後付」或「離店再付」之類的自動扣款服務後是給了對方直接扣款的授權,這一授權沒有期限,用過一次免密支付後商家隨時可以直接從賬戶扣款。不少網友擔心自己的資金安全。
梧州市網絡安全和文化交流協會關於公開招募會員的公告 - 天天要聞

梧州市網絡安全和文化交流協會關於公開招募會員的公告

梧州市網絡安全和文化交流協會關於公開招募會員的公告為進一步凝聚網絡行業力量、搭建交流平台,推動我市互聯網行業健康發展,梧州市網絡安全和文化交流協會決定面向社會公開招募會員。具體公告如下:一協會簡介本協會成立於2020年,是由市委網信辦主管的非營利性社會組織。協會致力於為全市網絡安全、網絡文化和自媒體從業...