智元机器人发布并开源首个机器人动作序列驱动的世界模型

2025年05月26日15:20:13 科技 8722
智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
作者 | 褚杏娟

近日,智元机器人重磅发布具身智能领域双重里程碑式突破:全球首个基于机器人动作序列驱动的具身世界模型 evac (enerverse-ac),以及具身世界模型评测基准 ewmbench。这两大创新成果现已全面开源,旨在构建“低成本模拟 - 标准化评测 - 高效迭代”的全新开发范式,持续赋能全球具身智能研究,加速技术落地与产业发展。

evac arxiv:https://arxiv.org/abs/2505.09723

evac 开源代码:https://github.com/agibottech/enerverse-ac

ewmbench arxiv: https://arxiv.org/abs/2505.09694

ewmbench 开源代码:https://github.com/agibottech/ewmbench

当前具身智能演进面临两大关键制约:在测试阶段,真机验证代价大、风险高,仿真系统又受制于虚实偏差;在数据层面,海量真机数据尚未构建基于轨迹扩增的高效利用机制,限制了多样性生成与泛化训练。为打破困局,智元机器人在去年发布的世界模型架构 enerverse 基础上推出创新成果:基于动作序列驱动的世界模型 evac 与具身世界模型评测榜单 ewmbench,构建从训练到评测全链路技术闭环,重新定义具身世界模型研发范式。

全球首个机器人动作序列驱动的世界模型

evac 是一个能够动态复现机器人与环境复杂交互的世界模型,标志着从传统仿真到生成式模拟的跃迁。

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
核心能力:从 “物理执行” 到“像素空间”的精准映射

evac 基于前序工作 enerverse 架构持续演进,创新型引入多级动作条件注入机制,实现 “物理动作 - 视觉动态” 的端到端生成,其核心能力体现在以下几个方面:

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
  • 机器人动作与像素的高精度对齐:将机械臂 6d 位姿(x,y,z,roll,pitch,yaw)与末端执行器行程投影为 action map,确保物理动作与图像帧的像素级对齐,精准建模 “抓取”、“放置”、“碰撞”、“推拉”、“快速抛掷”、“缓慢摇晃” 等复杂动力学行为;
  • 动态多视图建模:引入 ray map 编码相机运动轨迹,支持头部 、腕部等多视角协同生成一致且连贯的视觉场景,赋予机器人更全面的环境生成能力。;
  • 卓越的长时序一致性:采用 chunk-wise 自回归扩散架构与稀疏记忆机制(sparse memory),evac 能够实现单视图稳定生成长达 30 个连续片段、多视图下亦可维持 10 个连续片段的无漂移稳定输出,保证了模拟过程在时间轴上的连贯性与真实性;
  • 数据高效利用:融合 agibot-world 数据集 + 失败轨迹(如抓取滑脱、路径碰撞)提升生成质量,该策略能有效抑制幻觉现象,使模型能更合理、更全面地建模机器人与环境的交互动态。
生成式仿真评估 + 数据引擎双轮驱动
智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
  • 生成式仿真评测

针对真机评测成本高、风险大、难以复现等痛点,evac 开创性地提出了生成式模拟评测方案,它能与待评测的策略模型进行交替推理,构建起一套完整的交互式评测管线。实验显示,在多个任务中,evac 所生成的评测结果与真机评测的成功率具有高度一致性,甚至能够可靠地识别出性能更优的模型权重,大幅提升了策略模型的筛选效率。

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
  • 数据增广引擎

evac 能够基于极少量的专家轨迹数据,通过动作插值与高保真画面生成技术进行大规模数据增广。应用结果表明,采用 evac 数据增广数据训练的策略模型,其任务成功率提升高达 29%,目标跟随性得到显著改善,验证了这一方案在具身智能研究中的实用性与高性价比。

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
打造具身世界模型的 “质检尺”

为了科学、系统地衡量具身世界模型的性能表现,智元机器人推出了全球首个具身世界模型评测基准——ewmbench,旨在填补行业空白,构建统一、可信的评测标准。

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
三维度评估体系:场景 × 动作 × 语义的立体考核

针对机器人操作场景的复杂性与特殊性,ewmbench 构建了立体化的评估体系,从场景一致性、动作合理性 与 语义对齐与多样性 三大核心指标进行分析:

  • 场景一致性 scene consistency,评估生成场景中背景 / 物体 / 视角等稳固度与真实性,采用微调过的 dinov2 特征进行量化。
  • 动作合理性 motion correctness,利用 hsd (symmetric hausdorff distance), ndtw (normalized dynamic time warping) 和 dynamics score 三重互补指标协同精确评估生成动作的合理性与动力学真实度。
  • 语义对齐与多样性 semantic alignment & diversity,结合 mllm(多模态大模型)和 clip 从全局指令对齐度、关键步骤语义准确性、逻辑合理性等多个层次对生成视频进行语义理解评估。
智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
权威数据支撑与便捷开源工具
  • 基准数据集:ewmbench 基于行业领先的开源百万真机数据集 agibot world 构建,涵盖了家居、工业、医疗三大场景的 10 类典型机器人操作任务和刚体 / 柔体 / 流体 / 关节物体等多种交互对象,其中包含超过 300 个精心设计的测试样本及 30% 挑战性场景(低光照 / 部分遮挡),全面验证模型在复杂环境下的鲁棒性。
  • 开源评测工具:智元机器人同步开源了全流程评测工具,支持一键生成标准化对比报告,大幅降低评估门槛,方便研究者快速开展模型比较与性能分析,加速实验验证与成果复现。
卓越评测性能:更贴近人类主观感知
智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻

相较于当前主流视频生成评测基准 vbench,ewmbench 在评测结果与人类主观判断的一致性方面表现更优,能够更真实、细致地反映具身世界模型在交互理解、动作还原与视觉一致性等核心维度的实际能力。

enerverse 作为强大的世界模型基础架构,为 evac 提供可靠的基础框架与预训练能力,而 evac 生成的多样化高质量数据又能反哺 enerverse 模型的持续优化,二者形成 “训练 - 验证” 技术闭环,不断推动模型性能突破。通过 ewmbench 提供的精细化、多维度量化分析,研发团队可以精准定位 evac 在处理如 “多物体交互”“动态环境避障” 等复杂场景的潜在不足,从而进行更具针对性的优化。

据悉,evac 与 ewmbench 组合方案,已正式入选 agibot world challenge @ iros 2025 – world model 赛道的官方基线系统与评测标准。

活动推荐

6 月 27~28 日的 aicon 北京站将继续聚焦 ai 技术的前沿突破与产业落地,围绕 ai agent 构建、多模态应用、大模型推理性能优化、数据智能实践、ai 产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索 ai 应用的无限可能!

科技分类资讯推荐

华为天生会画数字艺术展亮相文博会:科技赋能艺术创作 - 天天要闻

华为天生会画数字艺术展亮相文博会:科技赋能艺术创作

【ZOL中关村在线原创新闻】5月22日,第二十一届中国(深圳)国际文化产业博览交易会在深圳盛大启幕。作为中国文化产业领域的年度盛会,本届文博会吸引了众多政府机构、文化团体和知名企业参展,集中展示了文化产业的最新成果与发展趋势。其中,华为天生会画数字艺术展人潮涌动,成为众多观众的热门打卡地。展览以“共绘自然...
荣耀400系列影像实力再升级 同档位难寻敌手 - 天天要闻

荣耀400系列影像实力再升级 同档位难寻敌手

【ZOL中关村在线原创新闻】荣耀400系列手机正式登场,其在影像领域的卓越表现令人瞩目,影像体验冠绝同档,为消费者带来了全新的拍摄体验。在硬件配置与算法优化上,荣耀400全系搭载2亿超清写真人像主摄,并融合AI人像意图识别引擎。这一强大组合让荣耀400系列实现了同档最清晰的成像体验以及更强的动态拍摄表现,无论是拍...
荣耀400系列AI影像革新:解锁创作自由,重塑日常AI体验 - 天天要闻

荣耀400系列AI影像革新:解锁创作自由,重塑日常AI体验

【ZOL中关村在线原创新闻】荣耀400系列手机正式发布,其AI影像创作能力迎来重大进化,多项创新功能国内首发,为影像创作领域注入全新活力,同时将AI体验深度融入日常生活,引领智能设备使用新风尚。在影像创作方面,荣耀400系列展现出了强大的技术实力。行业国内首发的AI图生视频功能,打破了图片与视频之间的壁垒,用户只...
荣耀400系列:超强AI赋能,性能续航双冠绝同档 - 天天要闻

荣耀400系列:超强AI赋能,性能续航双冠绝同档

【ZOL中关村在线原创新闻】荣耀400系列携超强AI能力震撼登场,在性能与续航方面实现全面升级,成为同档位手机中的佼佼者。在性能表现上,荣耀400全系借助超强AI能力,性能迎来质的飞跃。其中,荣耀400 Pro搭载满血版第三代骁龙8旗舰芯片,CPU、GPU以及AI各项性能均有显著提升。结合荣耀深厚的底层调教技术,为用户打造出更...
荣耀400 Pro上手评测:2亿超清写真人像重新定义移动影像标杆 - 天天要闻

荣耀400 Pro上手评测:2亿超清写真人像重新定义移动影像标杆

【ZOL中关村在线原创评测】不知道大家有没有一种感觉,虽然现在手机的影像配置越来越强大,但是普通用户依旧很难拍出让自己满意的照片,特别是在转瞬即逝的人生时刻,普通用户很难快速完成构图、光影、影调等方面的调整,快速拍下自己的人生照片。在此前的几代机型中,荣耀数字系列通过推出“单反级人像拍摄”和“全场景雅...
荣耀400系列:屏幕、护眼、功能全面升级 - 天天要闻

荣耀400系列:屏幕、护眼、功能全面升级

【ZOL中关村在线原创新闻】荣耀400系列手机正式发布,凭借在屏幕显示、护眼技术、功能拓展以及通信能力等多方面的卓越表现,尤其是屏幕体验冠绝同档,为消费者带来全方位的极致体验。屏幕方面,荣耀400系列搭载了一块拥有5000nits超级亮度的通透清晰好屏。如此高的亮度,即便在阳光直射的户外环境下,用户也能自由、清晰地...
小米卢伟冰:一个能打的对手都没有 SU7产品力表现强劲 - 天天要闻

小米卢伟冰:一个能打的对手都没有 SU7产品力表现强劲

站长之家(ChinaZ.com)5月28日 消息:今日,小米集团举行了2025年一季度业绩电话会,小米集团总裁卢伟冰等高层管理人员出席了此次会议。会上,针对小米汽车相关话题,卢伟冰发表了一系列看法。在回答媒体关于小米YU7标配激光雷达是否会对定价策略或盈利能力产生影响的问题时,卢伟冰指出,小米YU7产品力表现强劲。不过,目...
小米王腾:REDMI K80至尊版将是行业3K档最豪华的性能之王 - 天天要闻

小米王腾:REDMI K80至尊版将是行业3K档最豪华的性能之王

站长之家(ChinaZ.com)5月28日 消息:今日,小米中国区市场部总经理、REDMI品牌总经理王腾通过社交平台发文,提前为REDMI新机K80至尊版“预热”。他透露,REDMI K80至尊版将成为行业3K档最豪华的性能之王,不仅性能在安卓阵营中依旧占据领先地位,而且在配置方面进行了大幅升级,堪称脱胎换骨之作。据王腾剧透信息及相关爆...
王腾回应REDMI何时用玄戒芯片:急不来 成本太高 - 天天要闻

王腾回应REDMI何时用玄戒芯片:急不来 成本太高

站长之家(ChinaZ.com)5月28日 消息:近日,小米玄戒O1自研芯片发布后收获颇高热度,然而小米15S Pro因定价略高,让不少用户望而却步,众多网友纷纷期待玄戒芯片能下放到REDMI机型,以降低产品价格。针对这一呼声,王腾今日发布视频作出回应,直言“我们真的急不来”。王腾解释称,玄戒O1芯片初期研发成本高达135亿元,分摊...