AMD发布自己最强AI芯片:性能碾压H100,国内应该无法引入

2023年12月07日12:43:08 科技 1894

在AI芯片这部分,NVIDIA是目前全球范围内毫无争议的老大,不但出货量最高,同时性能部分也是最强的,几乎全球所有大型AI模型都采用了NVIDIA的AI芯片来提供算力。而在近日,AMD举行了“Advancing AI”发布会,正式推出了面向AI及HPC领域的GPU产品Instinct MI300A/MI300X加速器,直接与NVIDIA之前最强的AI芯片H100竞争。

AMD发布自己最强AI芯片:性能碾压H100,国内应该无法引入 - 天天要闻

事实上,AMD在今年六月就纸面发布MI300A和MI300X,现在MI300A和MI300X已经开始批量量产了,所以在这次发布会上AMD也公布了更多关于MI300A、MI300X的性能数据。AMD MI300A采用了Chiplet设计,其内部拥有多达13个小芯片,基于台积电5nm或6nm制程工艺CPU/GPU计算核心为5nm,HBM内存和I/O等为6nm),其中许多是3D堆叠的,以便创建一个面积可控的单芯片封装,总共集成1460 亿个晶体管

MI300A采用新一代的CDNA 3 GPU架构,拥有228个计算单元(14592个核心),并集成了24个Zen 4 CPU内核,配置了128GB的HBM3内存。MI300A的计算核心被8个HBM3内存包围,单个HBM3的带宽为6.3GB/s,八个16GB堆栈形成128GB统一内存,带宽高达5.3 TB/s。 MI300A提供了高达61 TFLOPS FP64算力,多达122 TFLOPS FP32算力。

AMD发布自己最强AI芯片:性能碾压H100,国内应该无法引入 - 天天要闻

至于MI300X,内部集成了12个5/6nm工艺的小芯片(HMB和I/O为6nm),拥有1530亿个晶体管,采用了更多计算核心的CDNA 3 GPU。MI300X的每个基于CDNA 3 GPU架构的GCD总共有40个计算单元,相当于2560个内核。总共有八个计算芯片(GCD),因此总共有320个计算和20480个核心单元。不过,就目前的量产版而言,会稍微有一些缩水。

在内存带宽方面,MI300X也配备了更大的 192GB HBM3内存,带来高达5.2TB/s的带宽和896GB/s的Infinity Fabric带宽。大型内存池在LLM(大语言模型)中非常重要,LLM大多是与内存绑定的,AMD可以通过在HBM内存容量上的领先地位来提升人工智能能力。

AMD发布自己最强AI芯片:性能碾压H100,国内应该无法引入 - 天天要闻

具体来看性能提升,MI300A APU提供了相比H100高达4倍的性能提升,与NVIDIA的Grace Hopper超级芯片相比,该系统每瓦的性能也提高了2倍。而更像纯粹GPU架构的MI300X,在具体的AI大模型加速性能对比当中,相比H100在 FlashAttention-2 和 Llama 2 70B 中提供了高达 20% 的性能提升。在各种整数和浮点性能上,MI300X都是H100的1.3倍,这的确相当让人震惊。

AMD之前内部估计全球数据中心AI加速器市场在2023年的规模可达约300亿美元,今后每年的复合增长率都能超过50%,到2027年将形成超过1500亿美元的价值。而现在AMD已经将2023年、2027年的数据中心AI加速器市场规模预期分别调高到400亿美元、4500亿美元,年复合增长率超过70%。

AMD发布自己最强AI芯片:性能碾压H100,国内应该无法引入 - 天天要闻

从目前来看,针对AI市场,AMD拿出了比NVIDIA更全面的方案,MI300A作为一个APU方案,实际上解决了很多厂商的问题,终端厂商只要采购MI300A就能自己推出OEM的AI PC;而在纯GPU方案上,MI300X现在也要强于H100不少,目前AMD要做的就是完善自己的生态,从而让更多厂商选择自己的芯片。当然无论是MI300A还是MI300X,其算力早就超过了美国出口管制的底线,所以这两款芯片大概率是没法在国内销售的。在美国商务部点名NVIDIA之后,AMD可能不会针对国内市场推出特供版。

科技分类资讯推荐

Steam 4 月硬件调查出炉,RTX5070显卡首度跻身 - 天天要闻

Steam 4 月硬件调查出炉,RTX5070显卡首度跻身

在刚刚过去的五一假期中,Steam如期上演了月度赛博斗蛐蛐环节:2025年4月steam硬件调查报告正式公布(Steam硬件调查数据均来自愿参与的用户,无法代表全球范围PC硬件份额情况)来自NVIDIA的GeForceRTX 5070/5070Ti/5080则是进入Steam硬件调查的统计榜单。其中RTX5070和RTX5080的市场占有率为0.38%,而R
618商家动员启动 红利电商平台发布经营方法论 - 天天要闻

618商家动员启动 红利电商平台发布经营方法论

封面新闻记者 蔡世奇 吴雨佳5月9日,得物在杭州举行的“Young新品主场”商家大会上,首次发布品牌经营方法论,为品牌商家明确提出从新品冷启动到打爆,再到全生命周期稳定长销的有效增长路径。
从智造到智行,北京科博会解码智慧出行全链条创新 - 天天要闻

从智造到智行,北京科博会解码智慧出行全链条创新

第二十七届中国北京国际科技产业博览会(简称“北京科博会”)释放“新未来”信号,是创新技术的竞技场。新京报贝壳财经记者探访北京科博会现场发现,从车联网、智能网联到赋能整车,再到氢能、钠离子电池等新能源技术的突破,从智造到智行,北京科博会正在上演智慧出行与绿色未来的变革。智慧巡查车自动化检测只需10秒在北...
机器人、无人车、修文物,北京市职教社携院校企业首次亮相科博会 - 天天要闻

机器人、无人车、修文物,北京市职教社携院校企业首次亮相科博会

第二十七届中国北京国际科技产业博览会正在举办,5月9日,北京市中华职业教育社首次以组团形式亮相科博会,组织北京科技职业大学、北京交通运输职业学院、学大教育等6家院校及企业参展。聚焦“科技引领 职教新行”主题,通过实物展示、图文介绍、现场体验三种模式进行展示,涵盖机器人、无人车、文物修复等多个领域,展现职...
阿维塔公布风阻系数测试结果:120kph测试风速下风阻系数Cd:0.217 - 天天要闻

阿维塔公布风阻系数测试结果:120kph测试风速下风阻系数Cd:0.217

近日,有博主发布视频称,某国产电车(阿维塔12)风阻系数“屡破纪录”,但实测发现“和20年前燃油车水平一样”。该博主表示,阿维塔12测出风阻系数为0.28cd,远高于此前阿维塔宣称的0.21cd。对此,阿维塔曾多次发文回应,称该消息不实,并表示将公开测试。5月9日晚,阿维塔官微公布风阻系数测试结果。“中国汽研权威机构实...
研发投入超过净利润2.5倍 科创板“含科量”持续上升 - 天天要闻

研发投入超过净利润2.5倍 科创板“含科量”持续上升

图片来源:视觉中国随着年报收官,科创板“含科量”亦浮出水面。根据上交所统计,科创板全年研发投入总额达到1680.78亿元,超过净利润2.5倍,同比增长6.4%,最近3年复合增速达10.7%。值得一提的是,科创板未盈利企业积极发挥科技创新主体作用,持续加大研发投入力度,带动自主创新能力不断提升。“含科量”不断增强2024年,...
数毛社:《GTA6》主机可能锁30帧 - 天天要闻

数毛社:《GTA6》主机可能锁30帧

Rockstar Games近日发布的《GTA6》第二支预告展示了令人惊叹的画面细节和复杂的开放世界,但技术专家根据对预告片的分析预测,游戏在主机上的运行帧率可能无法达到60FPS。Digital Foundry的专家分析,有迹象表明,《GTA6》在发售时很可能将以30帧/秒(FPS)运行,至少在主机平台上是如此。Digital Foundry团队指出,在分
用过一次免密支付后商家可随时扣款?微信、支付宝紧急回应 - 天天要闻

用过一次免密支付后商家可随时扣款?微信、支付宝紧急回应

今天,“自动扣款”相关话题登上热搜。有网友发帖称开通某个商家或APP的“先用后付”或“离店再付”之类的自动扣款服务后是给了对方直接扣款的授权,这一授权没有期限,用过一次免密支付后商家随时可以直接从账户扣款。不少网友担心自己的资金安全。