破局!国产AI芯片,从“依赖进口”转向“自主可控”的关键转折!

2025年04月04日17:43:03 科技 1475

中国变化太快了!——这是全球科技产业共同的心声!

3月24日DeepSeek上线最新的大模型版本DeepSeek-V3,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升,甚至代码能力追平美国Anthropic公司大模型Claude 3.7。

破局!国产AI芯片,从“依赖进口”转向“自主可控”的关键转折! - 天天要闻

就在同一天,根据彭博社消息,蚂蚁集团通过采用阿里巴巴、华为升腾等国产芯片,结合混合专家模型(MoE)架构,成功将AI大模型训练成本降低20%,单万亿Token训练成本从635万元降至508万元,而性能却能与英伟达H800芯片训练的顶级模型相匹敌

如上所述,由于DeepSeek的持续进化,国产AI的技术和能力已经接近全球最高水平,就如3月25日李开复所言:中国在某些领域已将其与美国在AI发展方面的差距缩小至只剩三个月,因为DeepSeek等公司已经摸索出如何更有效地利用芯片和应用算法

但AI芯片始终是困扰国产AI发展的一大障碍,而此次蚂蚁百灵凭借国产芯片训练,实现同等性能突破,还将训练成本再降20%;不仅撕开了西方技术垄断的铁幕,更标志着中国AI产业从“依赖进口”转向“自主可控”的关键转折

破局!国产AI芯片,从“依赖进口”转向“自主可控”的关键转折! - 天天要闻

据了解,此次蚂蚁百灵核心算力来自以下国产芯片生态:

1、阿里巴巴自研AI芯片:作为阿里云底层算力的核心,其性能在分布式训练中展现出高并行处理能力;

2、华为升腾系列:升腾910B芯片凭借达芬奇架构和异构计算优势,支撑了MoE模型的复杂路由机制;

3、壁仞科技BR系列:专为大规模AI训练设计,支持高带宽内存与低延迟通信;

4、天数智芯BI系列:通过软硬协同优化,提升低性能设备上的计算效率;

5、寒武纪思元系列在稀疏计算和动态负载分配上表现突出。

这些芯片通过异构计算平台的整合,构建了一个去中心化的算力网络,实现了“用中端硬件跑高端任务”的逆袭。

破局!国产AI芯片,从“依赖进口”转向“自主可控”的关键转折! - 天天要闻

另外,值得一提的是,蚂蚁百灵不仅核心算力来自国产芯片,同时还在三大核心技术上实现了突破。具体如下:

1、模型架构动态适配:根据国产芯片特性,调整MoE模型的专家数量与参数分布,例如在低性能设备上减少激活参数比例,避免算力瓶颈;

2、分布式训练框架重构:开源项目DLRover整合多平台框架,结合弹性分布式训练(EDiT)策略,将训练时间缩短66.1%,内存占用降低90%

3、异常处理与存储优化:通过实时监控系统与自动恢复机制,硬件故障对训练进度的影响被压缩至5%以内;同时,利用FUSE技术将I/O效率提升50%,解决了国产芯片集群的存储瓶颈。

这些创新不仅降低了硬件依赖,更开创了一条“软硬协同”的技术路线——用算法优化弥补硬件性能差距

这一趋势已引发连锁反应,3月26日英伟达股票暴跌5.7%,市值一夜蒸发约1.2万亿元与此相反,据说华为升腾、阿里平头哥等国产芯片厂商的订单量激增。正如科大讯飞与华为合作的升腾集群案例所示,中国AI产业正从“单点突破”迈向“生态协同”。

破局!国产AI芯片,从“依赖进口”转向“自主可控”的关键转折! - 天天要闻

因此,此次蚂蚁百灵在国产芯片的突破,以及开创性的利用“算法优化弥补硬件不足”的技术路线,表明国产AI厂商开始摆脱对英伟达GPU的绝对依赖,转向“AMD+国产”混合方案,甚至推动寒武纪、壁仞等厂商的芯片进入主流供应链

同时,由于蚂蚁百灵成本上的进一步降低,为中小企业和研究机构能以更低成本接入大模型训练铺平道路,例如Ling-Lite仅需27.5亿激活参数即可达到Llama3.1-8B的水平,大幅降低技术门槛。

科技分类资讯推荐

雷军亏钱卖车,小米汽车却交出最强财报 - 天天要闻

雷军亏钱卖车,小米汽车却交出最强财报

从小米汽车发布会以来,好像所有人都相信雷军在亏钱卖车,21.59万元的起售价,让所有人都相信小米汽车的定价是交个朋友,包括2月底上市的小米SU7 Ultra,52.99万元的售价,相比预售价降低了30万元,更加坐实小米在亏钱卖车。
绑定华为、阿里,200亿医疗龙头,撞开AI的大门! - 天天要闻

绑定华为、阿里,200亿医疗龙头,撞开AI的大门!

有机构预测,未来医疗行业将是人工智能应用最大的领域。 2030年,全球AI+医疗市场规模有望迎来爆发式增长,预计将达到惊人的1553亿美元。 从2022年至2030年,这一市场的年复合增速将高达35.5%,展现出强劲的发展势头。
小米高速事故冷思考:相比于情绪宣泄,我们更需要“智驾共识” - 天天要闻

小米高速事故冷思考:相比于情绪宣泄,我们更需要“智驾共识”

技术总要向前,重要的是研发者和使用者要先有基本认知和共识。作者|周永亮编辑|靖宇2025 年 3 月 29 日,一辆小米 SU7 标准版在德上高速公路池祁段行驶过程中,遭遇严重交通事故。即便小米创始人雷军第一时间在社交平台宣布,小米将“负责到底”,但一时之间,小米公司和创始人雷军成为众矢之的,甚至连小米公司股价,也...
麒麟操作系统兼容适配性工具:轻松破解应用兼容性问题! - 天天要闻

麒麟操作系统兼容适配性工具:轻松破解应用兼容性问题!

兼容适配工具。麒麟兼容性适配工具(KAT)可用于测试开发者的自研应用,通过一件事的上传测试,多维度的兼容评估,生成可视化的测试报告,可识别常见兼容性适配问题,如应用图标显示异常、应用无法升级、运行库缺失、启动时间过长等,帮助开发者提升应用质
微软首席技术官:2030年AI将生成95%代码,工程师成为指令引导者 - 天天要闻

微软首席技术官:2030年AI将生成95%代码,工程师成为指令引导者

IT之家 4 月 5 日消息,据外媒 TechSpot 当地时间周四报道,微软首席技术官 Kevin Scott 预测,到 2030 年,95% 的编程代码将由 AI 生成。不过,他迅速澄清,这并不意味着软件工程的工作将完全由 AI 接管。他同时澄清说,这并不意味着 AI 将取代软件工程师 —— 人类依然会写代码,但这一变化会让我们从编程语言的输入大师...
字节跳动深夜回应:与美政府尚未达成任何协议 - 天天要闻

字节跳动深夜回应:与美政府尚未达成任何协议

4月5日凌晨,@字节跳动发布声明称,字节跳动公司尚在与美政府商谈之中,未达成任何协议,双方在很多关键问题上仍存分歧。按照中国法律规定,任何协议均须经有关审查程序。据央视新闻4月5日报道,当地时间4月4日,美国总统特朗普在社交媒体上宣布,将再次推迟执行TikTok禁令75天。美国总统特朗普当地时间1月20日签署行政令,...
3000公里秒传,中国特高压闪电都追不上?西方这次真的酸了 - 天天要闻

3000公里秒传,中国特高压闪电都追不上?西方这次真的酸了

中国的特高压输电技术,让国际上很多国家都惊叹不已,3000公里的遥远距离,送电时间达到“秒传”根本不是夸张,闪电都追不上的速度,让西方羡慕哭了。中国打造的特高压输电技术,能够实现几千里送电时间,以秒为单位,这样的闪电速度,简直太科幻了。
玩具工厂引进自动化设备 产品不良率从2%降至0.5% - 天天要闻

玩具工厂引进自动化设备 产品不良率从2%降至0.5%

万格积木的展厅仿佛一个微缩的世界建筑博览馆。 德馨童娱澄海工厂的生产车间内,工人正组装玩具产品。 华丰玩具引入自动化设备提高生产效率。 第七印象展柜中陈列的玩具。电影《哪吒2》的全球热映,不仅让全球看到中国文化的魅力,相关周边产品热卖也推动着潮玩产业的发展。广东潮玩产业发展现状如何?中国制造与文化IP的创...