【硬件资讯】国产AI还是得用国产硬件啊!兆芯、摩尔线程全面支持DeepSeek,其他国产AI芯片也在路上!

2025年03月03日22:30:36 科技 1722

摩尔线程成功支持 deepseek 开源通信库 deepep 和并行算法 dualpipe

在 deepseek 开源周第四日,摩尔线程宣布已成功支持 deepseek 开源通信库 deepep 和并行算法 dualpipe,并发布相关开源代码仓库:mt-deepep 和 mt-dualpipe。
【硬件资讯】国产AI还是得用国产硬件啊!兆芯、摩尔线程全面支持DeepSeek,其他国产AI芯片也在路上! - 天天要闻
据介绍,deepep 是一个用于 moe(混合专家)模型训练和推理的开源 ep(expert parallelism,专家并行)通信库,主要适用于大模型训练,特别是需要 ep 的集群训练。它通过优化通信信道的使用率,提升了训练效率。摩尔线程基于 musa compute capability 3.1 全功能 gpu 适配了 deepep,并支持以下特性:
  • 高效优化的 all-to-all 通信,支持 dispatch & combine
  • 支持 mtlink + gpu(musa compute capability 3.1)节点内通信
  • 训练及推理预填充阶段的高吞吐量计算核心
  • 推理解码阶段的低延迟计算核心
  • 原生支持 fp8 数据分发
  • 灵活控制 gpu 资源,实现计算与通信的高效重叠
dualpipe 是 deepseek-v3 提出的双向流水线并行算法,通过前向计算与后向计算阶段的计算与通信完全重叠,减少了“流水线气泡”(设备空闲等待)。摩尔线程依托深度学习框架 torch-musa(已开源)和 musa 软件栈全方位的兼容性,实现了对 dualpipe 这一算法的支持。
目前,mt-dualpipe 可以完整接入摩尔线程 mt-megatron 框架和 mt-transformerengine 框架(即将开源),实现 deepseek v3 训练流程完整复现。此外,mt-dualpipe 结合 mt-megatron 可实现完整 deepseek v3 模型 mlp-ffn 分离以及 dw-dg 分离,进一步降低气泡占比,优化通信效率。同时,mt-dualpipe 与 mt-tranformerengine 和 mt-deepep 的结合,可利用 mt-deepep 和异步通信引擎实现更高效的通信掩盖,降低对计算资源损耗。
附 torch-musa 开源地址如下:
https://github.com/moorethreads/torch_musa

    

    deepseek上线时间也不短了,各种各样的ai应用厂商也纷纷接入,但我们似乎忘了最初令deepseek出圈的最大特色——更小的性能开销和不依赖cuda单元。而得益于此,国产芯片厂商也迎来了表现的机会。摩尔线程gpu对deepseek进行了深度支持,包括了开源通信库 deepep 和并行算法 dualpipe,也是获得了端侧运行deepseek的能力。不过,相比于主流的部署方案,摩尔线程gpu的性能还是太弱了些……期待能出现更强的ai特化产品吧。


兆芯官宣:全系列整机形态成功部署deepseek r1大模型

兆芯宣布,基于其高性能通用处理器的pc终端、工作站以及服务器成功实现deepseek-r1-distill模型(1.5b/7b/32b/70b/671b等)的本地部署,在保证推理效率的同时,能够提供灵活的算力选择,以满足不同规模和需求的推理生成应用,面向用户提供安全、智能、高效的ai应用体验。
【硬件资讯】国产AI还是得用国产硬件啊!兆芯、摩尔线程全面支持DeepSeek,其他国产AI芯片也在路上! - 天天要闻
兆芯高性能通用处理器具备覆盖笔记本、台式机、工作站、服务器的全栈硬件解决方案能力,以及强大的软件生态,原生支持以linux、windows、国产操作系统、及国产gpu加速卡等为基础的deepseek大模型生态。
  • kx-7000台式机 - 成功本地部署deepseek-r1-7b模型,实现高性能桌面平台与先进ai模型的完美结合,充分发挥deepseek强大的语义理解和推理能力, 通过与wps word、excel以及vscode等常用工具的整合,可以实现智能文档处理、数据处理以及智能编程等功能,为用户带来显著的生产力提升和智能化体验。
  • kh-40000/16服务器 - 成功部署deepseek-r1-7b/14b/32b模型,采用联和东海xrs302 ai工作站平台,搭配4张国内高性能gpu推理加速卡,可以提供信创+ai融合的高性价比、稳定高效的推理能力。
  • kh-40000/16工作站 - 成功部署deepseek-r1-32b模型,不仅能够更好发挥模型的强大能力,还能在性能、效率和稳定性上实现全面优化,为更智能的ai应用提供强有力的支持。
  • kh-40000/32双路服务器 - 支持本地部署deepseek r1 671b模型,能够为数学、编程和推理等多个领域应用提供安全可靠、高性能的平台与解决方案。
兆芯凭借已建立的完善且成熟的软硬件自主生态,支持多款国产gpu卡以及麒麟、统信、中科方德等国产操作系统,为部署deepseek模型提供了高性能、低成本、自主可控的解决方案。

    而另一国产芯片——兆芯,则同样受益于deepseek低性能开销的特性,目前,已经在多款设备上支持了deepseek r1大模型的部署。当然,由于配置的不同,部署的尺寸总7b到671b不等,但也算是起了个好头,希望能看到更多的国产硬件和国产ai的配合。


消息称小鹏自研图灵芯片有望 5 月上车:全面放弃英伟达 thor,性价比高太多

小鹏汽车于去年 8 月宣布自研图灵芯片流片成功,40 核心可运行 30b 参数 ai 大模型,号称面向 l4 自动驾驶打造。
据雷峰网今日援引知情人士消息,小鹏汽车自研芯片将在今年 5 月份实现首次上车。据悉,今年 5 月底或 6 月初,小鹏汽车将发布一款全新车型,该车将是搭载自研芯片的首款车型。
【硬件资讯】国产AI还是得用国产硬件啊!兆芯、摩尔线程全面支持DeepSeek,其他国产AI芯片也在路上! - 天天要闻
知情人士称,单颗图灵芯片算力比英伟达 orin x 的 254 tops 强大很多,只比还未量产的英伟达 thor 的中配版低一点。“(图灵芯片算力)对于小鹏来说是足够了,而且性价比比 thor 高太多了。”
该知情人士还透露,小鹏汽车现在“完全不鸟英伟达了”,只是在涉及此前 orin 芯片项目时才有联系。据透露,小鹏汽车接下来所有全新车型都将会搭载自研芯片,不再计划搭载 thor 芯片。
【硬件资讯】国产AI还是得用国产硬件啊!兆芯、摩尔线程全面支持DeepSeek,其他国产AI芯片也在路上! - 天天要闻
报道还提到,今年小鹏汽车将有多款全新车型会上市,规划之中的 g01 是比 g9 更大的一款 7 座 suv;还有一款全新车型叫 g7,比 g6 更高一级;此外,mpv 车型 x9 的改款车型将会增加增程版本。“全新车型可能有 4 个,算上大改款、小改款,小鹏今年的新车型或多达十几款。”上述知情人士表示。
【硬件资讯】国产AI还是得用国产硬件啊!兆芯、摩尔线程全面支持DeepSeek,其他国产AI芯片也在路上! - 天天要闻
it之家从小鹏汽车发布会获悉,小鹏图灵 ai 芯片可同时应用在 ai 机器人、ai 汽车、飞行汽车上,号称与英伟达 orin x 相比一颗顶三颗,自动驾驶、智能座舱大模型都可驱动。去年 10 月份,小鹏已经在图灵芯片上跑通了智驾功能。
【硬件资讯】国产AI还是得用国产硬件啊!兆芯、摩尔线程全面支持DeepSeek,其他国产AI芯片也在路上! - 天天要闻
小鹏汽车还表示,经过深度定制,图灵芯片算力可达到 100% 极致利用,未来 ai 汽车将搭载至少 3 颗图灵芯片。

    而在deepseek以外的应用ai领域,智驾显然是很好的应用场景。而国产新能源汽车厂商中,小鹏显然选择了更难但做好之后收益更高的选择——自研芯片。事实上,新能源车企中的领头羊选手——特斯拉,就是这样选择的。据称新的专用芯片会比nvidia orin x算力还要高,而且可能在5月底或6月初就会有首款芯片搭载,不知道这种专用的ai芯片能不能再智驾领域有更好的表现了。



欢迎加入
备注
    文章转载自网络(链接如上)。文章出现的任何图片,标志均属于其合法持有人;本文仅作传递信息之用。如有侵权可在本文内留言。
    引用文章内容与观点不代表电脑吧评测室观点。

科技分类资讯推荐

长安与东风重组新进展:朱华荣称不会改变长安既定战略 - 天天要闻

长安与东风重组新进展:朱华荣称不会改变长安既定战略

2月9日,长安汽车和东风集团股份(00489.HK)同步发布了控股股东“正在与其他国资央企集团筹划重组事项”的信息。长安汽车的控股股东是兵装集团,而东风集团股份的控股股东是东风公司。随即,长安汽车和东风集团这两家汽车央企将合并重组,成为业内关注的焦点。
公安部出手了!年龄限制放宽10年、送考下乡,2025年考驾照不难了 - 天天要闻

公安部出手了!年龄限制放宽10年、送考下乡,2025年考驾照不难了

电动车加强管理以后,要求机动车类型的车辆需要持证上路,但是老年人考驾照却受阻,一方面有年龄的限制,另一方面偏远山区考驾照不方便,所以在2025年公安部出手了,年龄限制放宽10年,同时推出送考下乡服务,还进一步的降低考驾照的费用,2025年起考摩托车驾照不难了。
从“星灵安全守护体系”到昊铂HL,看懂广汽科技日 - 天天要闻

从“星灵安全守护体系”到昊铂HL,看懂广汽科技日

发布会以技术切入,并全程围绕安全展开。广汽集团董事长、总经理冯兴亚率先登场,宣布2025年四季度将正式上市支持L3级智能驾驶的车型,他同时强调面向自动驾驶时代对智能驾驶技术、整车安全架构以及突发风险处理能力的要求更高。如何才能满足更高的要求?冯兴亚提到了“广汽
关税大棒下,最受伤的车企出现了 - 天天要闻

关税大棒下,最受伤的车企出现了

特朗普的关税大棒刚挥出,尚未吓退“外敌”,却先刺痛了自己。近日,拥有玛莎拉蒂、Jeep等14个品牌的全球第四大车企斯泰兰蒂斯突然宣布裁撤900名美国工人,关闭加拿大和墨西哥两家工厂,北美生产线陷入瘫痪。几乎同一时间,捷豹路虎宣布暂停对美出口一个月,奥迪更是直接