英特尔披露5nm“中国特供版”AI 芯片,性能或暴降92%,最快6月推出

2024年04月28日04:51:51 科技 9345

英特尔披露5nm“中国特供版”AI 芯片,性能或暴降92%,最快6月推出 - 天天要闻

关于英特尔gaudi 3的“中国特供版” ai 芯片有了新进展。

钛媒体app 4月15日消息,芯片巨头英特尔(intel)日前在官网发布一份24页的“gaudi 3 ai加速器白皮书”中披露,英特尔将推出gaudi 3在中国发售的两款“特供版”ai 芯片产品。

具体包括两种硬件形态加速卡:一款型号为hl-328的oam兼容夹层卡(mezzanine card),预计将于今年6月24日推出;另一款是型号为hl-388的pcle加速卡,预计将于今年9月24日推出。而基于内核数量、工作频率、tdp等参数估算,相比gaudi 3国际版,“中国特供版”hl-328芯片性能或降低约92%左右。

英特尔披露5nm“中国特供版”AI 芯片,性能或暴降92%,最快6月推出 - 天天要闻

早前4月9日举行的美国intel vision 2024会议上,英特尔发布新一代gaudi 3 ai 加速芯片,采用台积电5nm工艺,带来4倍(400%)的bf16 ai计算能力提升。同时,相比英伟达h100 gpu,英特尔gaudi 3 ai芯片的模型训练速度提升40%,推理速度提升50%,平均性能提高 50%,能效平均提高40%,但成本却仅为h100的一小部分。

对于gaudi 3中国特供版消息,钛媒体app已向英特尔美国总部发送邮件询问更多详细信息,但截至发稿前,英特尔方面并未回复。

据悉,过去一段时间,美国政府不断升级对华半导体、ai 芯片等领域的出口管制。

2022年8月9日,美国总统拜登签署总额高达2800亿美元的《芯片和科学法案》(以下简称“芯片法案”),通过527亿美元的巨额产业补贴和遏制竞争的条款,推动芯片制造“回流”美国本土。该法案禁止获得补贴的美国及其盟友伙伴的企业10年内在中国和其他关切的国家新建或扩大先进制程芯片厂。

2022年10月7日、2023年10月17日,美国商务部工业和安全局(bis)连续两次发布对中国的先进半导体和计算设备的出口管制,旨在阻止中国进口 ai 半导体产品。同时,英伟达、amd、英特尔的多款gpu和 ai 芯片产品已不能再出口到中国,就连高端游戏显卡rtx 4090都受到了限制。

2023年12月,美国商务部bis宣布启动对成熟制程节点的半导体供应链展开调查,剑指中国芯片半导体产业。

2024年3月29日,bis更新出口限制措施,其中包括美国对中国出口的 ai 半导体产品将采取“逐案审查”(case-by-case review)政策规则,包括技术级别、客户身份、合规计划等信息全面查验,以及部分 ai pc 芯片或纳入到出口管制措施当中,更大范围限制英伟达、amd等先进 ai 芯片和半导体设备向中国销售,4月4日全面生效。

4月11日,美国商务部在“联合公报”(federal register)上更新了最新的实体清单(entity list),将6家中国企业列入“实体清单”,其中包括英伟达在中国的最大 ai 芯片经销商思腾合力(天津)科技有限公司(sitonholy (tianjin) co., ltd.)。

事实上,在美国bis第一轮出口管制下,早在2023年7月,英特尔就曾发布基于7nm制程的“中国特供版”ai芯片gaudi2。相比国际版gaudi2,面向中国市场推出的加速卡在性能上差别不大,而集成以太网rdma端口数量从24个端口减到21个,以符合美国芯片出口管制规定。(详见钛媒体app前文:《英特尔发布中国特供版7nm ai芯片gaudi2,减少rdma接口以符合出口管制规定》)

然而,钛媒体app了解到,英特尔gaudi 2中国特供版仅销售几十张oam产品。自去年bis 1017新规更新后,由于英特尔gaudi 2“中国特供版”产品性能高于出口管制措施,最终导致其产品再也没能继续销往中国市场。

基于此,去年12月前后,英特尔曾尝试研发gaudi 2 hl-225b变体,内部称gaudi 2c ai芯片,希望重新获得销往中国大陆的许可,但最后却等到今年3月bis公布更新出口限制措施。

4月10日发布gaudi 3之后,英特尔重新研发特供版产品,希望让5nm gaudi 3 ai芯片未来全力争夺中国市场,旨在为 ai 和云客户提供英伟达产品的“替代选择”。

具体硬件规格方面,中国特供版的gaudi 3 与原版相比,具有相同的96mb sram片上内存, 128gb hbm2e高带宽内存,带宽为 3.7tb/s,拥有pcie 5.0 x16 接口和解码标准。但是,由于美国对于ai芯片的出口管制规则限制,使得这类高性能ai的综合运算性能(tpp)需要低于4800才能出口到中国, 这意味中国特供版的gaudi 3 的16bit性能不能超过150 tflops。

相比gaudi 3 国际版达到的1835 tflops(fp16/bf16),中国特供版gaudi 3 需要大幅削减内核数量和工作频率,最终可能需要其ai性能降低约92%,才能符合美国的出口管制要求。

同时,由于中国特供版gaudi 3产品的ai性能降低,这也将使得其tdp(热设计功耗)大幅降低,预计oam卡和pcie卡的tdp均为450瓦,而原版pcie卡(hl-338)的tdp高达600瓦,原版oam卡(hl-325l、hl-335)的tdp更是高达900瓦。

整体来说,英特尔专为中国市场推出的“特供版”gaudi 3两款产品的 ai 性能,或将与英伟达“中国特供版”ai 加速卡h20水平相当,后者比h100的整体性能降低80%左右,达148 tflops的fp16/bf16性能,略低于出口管制的150 tflops的限制。

目前,英伟达h20 ai芯片已经向中国大陆客户送样,但国内百度、阿里等 ai 龙头对其反响平平。有行业人士对钛媒体app表示,主要原因是h20性能太低、价格太高,企业购买意愿降低了。

美国商务部长雷蒙多(gina raimondo)早前在一场公开论坛中表示,美国绝不能让中国得到这些最尖端的芯片,绝不能让中国芯片技术赶超美国。美国政府不允许英伟达向中国出售“最复杂、处理能力最高”的 ai 芯片,以防中国有能力训练前沿 ai 模型。

此外,有消息称,美国政府还正在制定一份禁止接收关键工具的中国先进芯片制造工厂名单,以便美国企业更容易阻止技术流入中国,这份名单可能会在未来几个月内公布。同时,美国正向包括荷兰、日本、德国和韩国在内的盟友施压加码,要求它们进一步收紧对中国获得半导体技术的限制措施。

针对于美方行动,外交部发言人毛宁在4月11日表示,“我们坚决反对美方滥用实体清单等出口管制工具遏制打压中国企业,敦促美方停止将经贸科技问题政治化、工具化、武器化。中方将采取必要措施坚决维护中国企业的合法权益。”

(本文首发钛媒体app,作者|林志佳)

科技分类资讯推荐

早资道 | 阿里通义千问2.5大模型发布;淘宝宣布将为超百万份订单免单 - 天天要闻

早资道 | 阿里通义千问2.5大模型发布;淘宝宣布将为超百万份订单免单

阿里通义千问2.5大模型发布5月9日消息,通义千问2.5大模型发布。阿里云智能集团首席技术官周靖人称,在中文语境下,文本理解、文本生成、知识问答&生活建议、闲聊&对话,和安全风险等多项能力上赶超GPT-4。华为否认WATCH GT4 Pro手表上市计划华为终端BG首席执行官华为何刚5月9日发布预热,华为WATCH FIT 3手表将于5月15日在...
iFlight 推出 4.9GHz 无人机模拟图传系统,售 59 美元 - 天天要闻

iFlight 推出 4.9GHz 无人机模拟图传系统,售 59 美元

IT之家 5 月 10 日消息,市面上 FPV 无人机通常采用 5.8/2.4/1.2GHz 频段的模拟图传系统,不过无人机制造商 iFlight 近日推出了一款使用 4.9GHz 频段的图传接收模块,该模块兼容 FatShark 和 SkyZone FPV 眼镜,售 59.99 美元(IT之家备注:当前约 433 元人民币)。据介绍,这款图传系统在 499
荣耀 X50 手机中国市场销量突破 1000 万,用时 10 个月 - 天天要闻

荣耀 X50 手机中国市场销量突破 1000 万,用时 10 个月

IT之家 5 月 10 日消息,荣耀终端有限公司中国区 CMO 姜海荣今日宣布,荣耀 X50 推出至今历经 10 个月,其在中国市场的销量已成功突破 1000 万,这也是 2023 年以来发布产品中第一款中国市场销量突破千万的安卓单品。据IT之家了解,荣耀 X50 手机发布于 2023 年 7 月 5 日,搭载骁龙 6 Gen 1 处理器,号称“荣耀十周年登
苹果为新款iPad Pro广告道歉 强调“创新是苹果的根” - 天天要闻

苹果为新款iPad Pro广告道歉 强调“创新是苹果的根”

【CNMO科技消息】苹果公司决定撤回其备受争议的iPad Pro“压力测试”广告,并就其对艺术创作情感的忽视公开致歉。  本周二的苹果新品发布会上,新一代iPad Air与iPad Pro系列正式登场,其间还插播了一条新款iPad Pro的宣传视频——“压力之下”。这则六十秒的短片以一种另类手法呈现:从颜料管到吉他,乃至玩具与雕塑,各...
三星F55将于5月17日在海外发布 同级别最轻薄素皮手机 - 天天要闻

三星F55将于5月17日在海外发布 同级别最轻薄素皮手机

【CNMO科技消息】三星即将在印度时间5月17日正午12点正式发布Galaxy F55新机。据了解,这款新机定价亲民,在20000至29999卢比区间内,具体数字为29999卢比,约合人民币2599元。  Galaxy F55实际上是上月在中国首发的Galaxy C55的小改款,换上了全新的命名登陆印度市场。F55的一大亮点是拥有同级别最薄的纯素皮革材质,其
湾区三分钟丨中试平台“小试牛刀”如何“大显身手”? - 天天要闻

湾区三分钟丨中试平台“小试牛刀”如何“大显身手”?

湾区三分钟,道理讲透透。地上建公园,地下17米就是服务近200万居民的污水工厂。位于广州市海珠区的沥滘净水厂,如何将污水处理工厂变成公园,成为受欢迎的“邻居”?废气是污水处理厂让不少人避之不及的,但在这里,生物除臭技术的企业却抓住了新机会,找到了新商机。其中的关键在于生物除臭新技术的应用,科技成果转化成...
Drop 与 Axel Grell 推出联名头戴式耳机:限 1000 台,349 美元 - 天天要闻

Drop 与 Axel Grell 推出联名头戴式耳机:限 1000 台,349 美元

IT之家 5 月 9 日消息,海盗船旗下键盘与音频外设电商 Drop 与前森海塞尔工程师 Axel Grell 联名推出 Drop + Grell OAE1 Signature 头戴式耳机,限量 1000 台,定价 399 美元(IT之家备注:当前约 2885 元人民币),预售价 349 美元(当前约 2523 元人民币)。据介绍,Axel Grell 曾参
阿里云发布通义千问2.5版 性能赶超GPT-4 Turbo - 天天要闻

阿里云发布通义千问2.5版 性能赶超GPT-4 Turbo

站长之家(ChinaZ.com)5月9日 消息:阿里云今日正式发布通义千问2.5版本,该版本在模型性能上全面赶超了GPT-4Turbo,展现了其强大的技术实力。与此同时,通义千问最新开源的1100亿参数模型Qwen1.5-110B在多个基准测评中取得了卓越成绩,超越了Meta的Llama-3-70B模型,成为开源领域的新星。与通义千问2.1版本相比,2.5版