CANN核心能力全新升级、深度开放,构筑升腾AI创新基石     

2025年05月28日14:00:18 科技 9323

5月23日,“鲲鹏升腾开发者大会2025”上,华为升腾计算业务总裁张迪煊围绕“一起升腾 共绽光芒”解读了升腾ai的技术战略与生态布局。他表示,升腾异构计算架构cann(compute architecture for neural networks)作为升腾ai的核心软件平台,始终以“使能每一位创新者”为目标,坚持深度开放策略,持续技术创新,释放硬件极致潜能,推动ai开发效率与性能的双重突破。本次大会带来了多项重磅技术升级,并通过构建全面开放的创新生态与极致效能的算力底座,携手全球开发者加速ai技术向千行万业渗透,以智能算力革命重塑产业创新范式。

CANN核心能力全新升级、深度开放,构筑升腾AI创新基石      - 天天要闻

生态构建开发者赋能:从人才培养到生态共建 激活产业创新活力

升腾cann以"使能每一位创新者"为核心理念,自2023年宣布深度开放以来,通过多维协同创新构建开发者友好型ai生态,当前由6000+认证开发者组成的创新社区持续释放技术势能。截至目前,已携手互联网、运营商、金融等30多个伙伴,创新开发260多个高性能算子,大幅提升业务场景性能表现。

cann在技术创新之路上成果丰硕。在操作系统层面,打造多样化os,兼容鸿蒙、欧拉等,为开发运行筑牢根基。cann开源算子加速库、通信算法、ascend c、集合通信库等组件已在gitee社区上线260+算子、10+通信算法参考样例,显著提升开发效率。整图优化方面,提供内存复用、自动调度等加速技术,加速模型计算效率。

这种"基础层开放+应用层共创"的双轮驱动模式,不仅重塑了ai算力效能边界,更推动了ai产业链的协同进化,形成从技术突破到商业转化的生态闭环。

深度开放再升级:分层架构匹配多元开发场景 开发效率显著提升

在ai开发效率成为产业竞争焦点的当下,升腾cann通过分层开放架构实现技术普惠化跃迁,构建起覆盖算子开发、系统调优到编译链优化的全场景赋能体系,实现“效率与性能兼得”的开发体验升级:

最佳实践赋能,降低开发门槛:发布catlass算子模板库,分层提供device层调用接口、kernel层完整实现及block/tile/basic层拆解源码,实现matmul开发周期缩至50%;开源ascend c 2.0并提供丰富开发接口,结合算子加速库(aol)与集合通信库(hccl),搭配gitee社区参考样例,助力开发者快速完成算子开发与调优。

开放底层原子能力,释放极致性能:开放190+runtime运行时接口,提供底层原子级能力,支持灵活组合,允许开发者直接调用npu硬件的原子级能力,实现整图调度优化与硬件性能极限挖掘。

毕升编译器构建开放生态,兼容主流开发体系:毕升编译器以“全链路优化+生态兼容”为核心,打造开发者友好型工具链。在编译优化层面,前端支持异构混合编程,中端优化使算子性能提升20%+,后端实现内存问题分钟级定位;在生态开放层面,开放ascendnpu ir接口,实现开发者“无感迁移”开发体验,同时通过开源社区持续输出技术能力,推动升腾与全球ai开发生态的深度融合。在生态建设上,通过毕升编译器的升级与开放,实现与triton、flagtree等第三方编程框架的无感对接。

升腾cann核心技术引领:计算-内存-通信"三驾马车"重构ai算力基因

伴随ai技术持续突破,模型优化技术从“模型结构创新”延伸到“训推全流程”算法创新,从模型层面算法优化,下探到底层硬件资源的极致利用。cann是充分释放处理器极致性能的关键,今年升腾在计算加速、通信加速、内存优化三大领域协同发力,持续释放硬件价值,创新加速技术,以满足前沿模型架构及工程创新的发展诉求。

在计算优化领域,通过mlapo融合算子技术,将moe模型中13个串行小算子整合为超级大算子,结合vector与cube计算单元并行处理,使计算耗时从109ms降至45ms,性能提升超142%,显著释放硬件计算潜力。

通信效率突破上,npudirect通信算法革新传统rdma异步通信模式,实现“单消息一次同步”机制,使小包通信耗时降低90%,整网通信时延减少50%,在大规模moe模型推理中大幅提升数据传输效率。

内存管理方面,创新多重地址映射技术,动态切分物理内存适配虚拟地址,有效拼接不连续空闲内存,将内存利用率提升20%以上,破解动态shape场景下的碎片难题。

三大技术协同突破,构建起升腾cann“计算高效、通信敏捷、内存精细”的底层技术体系,为ai模型训推全流程提供极致算力支撑,引领ai基础设施性能跃迁。

从分层开放的生态裂变到计算-内存-通信的原子级突破,升腾cann正以"技术纵深的突破与生态广度的延展"双轮驱动,重塑ai产业的创新范式。这不仅是一场硬件算力的革命,更是一场开发者与技术的共进化。在这场波澜壮阔的算力跃升征途中,升腾cann不仅是中国ai创新的技术底座,更是全球开发者突破想象边界的星辰大海——以开放之姿,与时代共升腾;以极致之力,与未来共绽放。

科技分类资讯推荐

蔚来与极氪实现充电网络双向互联互通 - 天天要闻

蔚来与极氪实现充电网络双向互联互通

国内两家新能源汽车服务企业近期达成基础设施共享协议。5月29日,武汉蔚来能源有限公司与浙江浩瀚能源科技有限公司宣布建立充电网络双向互通合作关系。根据协议,双方将基于实时数据交互实现充电设施资源的跨平台共享,打破原有充电网络相互独立的状态。
vivo S30搭载索尼MX882大底传感器,支持五大黄金焦段人像 - 天天要闻

vivo S30搭载索尼MX882大底传感器,支持五大黄金焦段人像

【ZOL中关村在线原创新闻】虽然是标准版,但vivo S30影像并不弱,它采用X200S同款的索尼MX882大底传感器,配合超大光圈旗舰同款的镜片镀膜,在旗舰同款的自研原向引擎和大模型画质增强技术的加持下,S30长焦几乎可以媲美主摄的画质、色彩和动态范围。一直以来,S系列的人像效果都堪称行业标杆。S30不仅配备了一颗旗舰长焦,...
非比寻长,雅迪冠能S以科技重构全场景长续航生态体系 - 天天要闻

非比寻长,雅迪冠能S以科技重构全场景长续航生态体系

当两轮出行成为新的风尚,市场的打法与战略思维也到了升级的节点。据不完全统计,我国两轮电动车用户已超4亿人,时代与场景的变化,使用户的需求也在发生着更迭。以用户为第一性原理去造好车,是品牌突围的关键,更是打造卓越出行体验的关键。在消费升级浪潮下,用户对长续航的需求已从“基础功能”升维为“品质刚需”,这...
《科技湘军勇登攀》创新创业演讲季(第二季)定档530 - 天天要闻

《科技湘军勇登攀》创新创业演讲季(第二季)定档530

湖南日报5月29日讯(文字/视频 全媒体记者 王铭俊 通讯员 全程铂)科技浪潮奔涌向前,科技湘军再攀高峰!由湖南省委科技委员会办公室、湖南省科学技术厅特别策划的《科技湘军勇登攀》创新创业演讲季(第二季)将于5月30日“全国科技工作者日”推出
从循环过滤到恒温调控,AQUA爱克泳池设备如何实现泳池水质长效达标? - 天天要闻

从循环过滤到恒温调控,AQUA爱克泳池设备如何实现泳池水质长效达标?

随着游泳运动的日益普及,泳池设施的需求持续攀升。作为保障泳池水质安全与用户舒适体验的核心,泳池水处理设备的品质与性能愈发重要。相关资料显示,在这一领域,知名泳池设备品牌AQUA爱克多年来专注于研发与生产,为各类泳池提供全方位、高品质的水处理解决方案,赢得了广泛的信赖与好评。构建泳池水处理生态链,全周期保...
奖励是假的,能让Qwen提升25%性能却是真的! - 天天要闻

奖励是假的,能让Qwen提升25%性能却是真的!

鹭羽 发自 凹非寺量子位 | 公众号 QbitAI即使RLVR(可验证奖励强化学习)使用错误的奖励信号,Qwen性能也能得到显著提升?甚至还和真实奖励相差无几。自从RLVR被DeepSeek-R1带火,RL推理研究层出不穷,走进了蜜月期。
三星One UI 8为Galaxy Buds带来更深入集成,设置App直接管理耳机 - 天天要闻

三星One UI 8为Galaxy Buds带来更深入集成,设置App直接管理耳机

IT之家 5 月 29 日消息,据外媒 Sammobile 今日报道,三星 One UI 8 的首个测试版昨日已在部分国家上线,率先适配 Galaxy S25 系列。和以往一样,新版本引入了多项功能更新,其中一项三星在公告及更新日志中并未提及的内容,是 Galaxy Buds 设置的进一步整合。在 One UI 8 中,用户能够更轻松地管理 Galaxy B