智元机器人发布并开源首个机器人动作序列驱动的世界模型

2025年05月26日15:20:13 科技 8722
智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
作者 | 褚杏娟

近日,智元机器人重磅发布具身智能领域双重里程碑式突破:全球首个基于机器人动作序列驱动的具身世界模型 evac (enerverse-ac),以及具身世界模型评测基准 ewmbench。这两大创新成果现已全面开源,旨在构建“低成本模拟 - 标准化评测 - 高效迭代”的全新开发范式,持续赋能全球具身智能研究,加速技术落地与产业发展。

evac arxiv:https://arxiv.org/abs/2505.09723

evac 开源代码:https://github.com/agibottech/enerverse-ac

ewmbench arxiv: https://arxiv.org/abs/2505.09694

ewmbench 开源代码:https://github.com/agibottech/ewmbench

当前具身智能演进面临两大关键制约:在测试阶段,真机验证代价大、风险高,仿真系统又受制于虚实偏差;在数据层面,海量真机数据尚未构建基于轨迹扩增的高效利用机制,限制了多样性生成与泛化训练。为打破困局,智元机器人在去年发布的世界模型架构 enerverse 基础上推出创新成果:基于动作序列驱动的世界模型 evac 与具身世界模型评测榜单 ewmbench,构建从训练到评测全链路技术闭环,重新定义具身世界模型研发范式。

全球首个机器人动作序列驱动的世界模型

evac 是一个能够动态复现机器人与环境复杂交互的世界模型,标志着从传统仿真到生成式模拟的跃迁。

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
核心能力:从 “物理执行” 到“像素空间”的精准映射

evac 基于前序工作 enerverse 架构持续演进,创新型引入多级动作条件注入机制,实现 “物理动作 - 视觉动态” 的端到端生成,其核心能力体现在以下几个方面:

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
  • 机器人动作与像素的高精度对齐:将机械臂 6d 位姿(x,y,z,roll,pitch,yaw)与末端执行器行程投影为 action map,确保物理动作与图像帧的像素级对齐,精准建模 “抓取”、“放置”、“碰撞”、“推拉”、“快速抛掷”、“缓慢摇晃” 等复杂动力学行为;
  • 动态多视图建模:引入 ray map 编码相机运动轨迹,支持头部 、腕部等多视角协同生成一致且连贯的视觉场景,赋予机器人更全面的环境生成能力。;
  • 卓越的长时序一致性:采用 chunk-wise 自回归扩散架构与稀疏记忆机制(sparse memory),evac 能够实现单视图稳定生成长达 30 个连续片段、多视图下亦可维持 10 个连续片段的无漂移稳定输出,保证了模拟过程在时间轴上的连贯性与真实性;
  • 数据高效利用:融合 agibot-world 数据集 + 失败轨迹(如抓取滑脱、路径碰撞)提升生成质量,该策略能有效抑制幻觉现象,使模型能更合理、更全面地建模机器人与环境的交互动态。
生成式仿真评估 + 数据引擎双轮驱动
智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
  • 生成式仿真评测

针对真机评测成本高、风险大、难以复现等痛点,evac 开创性地提出了生成式模拟评测方案,它能与待评测的策略模型进行交替推理,构建起一套完整的交互式评测管线。实验显示,在多个任务中,evac 所生成的评测结果与真机评测的成功率具有高度一致性,甚至能够可靠地识别出性能更优的模型权重,大幅提升了策略模型的筛选效率。

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
  • 数据增广引擎

evac 能够基于极少量的专家轨迹数据,通过动作插值与高保真画面生成技术进行大规模数据增广。应用结果表明,采用 evac 数据增广数据训练的策略模型,其任务成功率提升高达 29%,目标跟随性得到显著改善,验证了这一方案在具身智能研究中的实用性与高性价比。

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
打造具身世界模型的 “质检尺”

为了科学、系统地衡量具身世界模型的性能表现,智元机器人推出了全球首个具身世界模型评测基准——ewmbench,旨在填补行业空白,构建统一、可信的评测标准。

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
三维度评估体系:场景 × 动作 × 语义的立体考核

针对机器人操作场景的复杂性与特殊性,ewmbench 构建了立体化的评估体系,从场景一致性、动作合理性 与 语义对齐与多样性 三大核心指标进行分析:

  • 场景一致性 scene consistency,评估生成场景中背景 / 物体 / 视角等稳固度与真实性,采用微调过的 dinov2 特征进行量化。
  • 动作合理性 motion correctness,利用 hsd (symmetric hausdorff distance), ndtw (normalized dynamic time warping) 和 dynamics score 三重互补指标协同精确评估生成动作的合理性与动力学真实度。
  • 语义对齐与多样性 semantic alignment & diversity,结合 mllm(多模态大模型)和 clip 从全局指令对齐度、关键步骤语义准确性、逻辑合理性等多个层次对生成视频进行语义理解评估。
智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
权威数据支撑与便捷开源工具
  • 基准数据集:ewmbench 基于行业领先的开源百万真机数据集 agibot world 构建,涵盖了家居、工业、医疗三大场景的 10 类典型机器人操作任务和刚体 / 柔体 / 流体 / 关节物体等多种交互对象,其中包含超过 300 个精心设计的测试样本及 30% 挑战性场景(低光照 / 部分遮挡),全面验证模型在复杂环境下的鲁棒性。
  • 开源评测工具:智元机器人同步开源了全流程评测工具,支持一键生成标准化对比报告,大幅降低评估门槛,方便研究者快速开展模型比较与性能分析,加速实验验证与成果复现。
卓越评测性能:更贴近人类主观感知
智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻

相较于当前主流视频生成评测基准 vbench,ewmbench 在评测结果与人类主观判断的一致性方面表现更优,能够更真实、细致地反映具身世界模型在交互理解、动作还原与视觉一致性等核心维度的实际能力。

enerverse 作为强大的世界模型基础架构,为 evac 提供可靠的基础框架与预训练能力,而 evac 生成的多样化高质量数据又能反哺 enerverse 模型的持续优化,二者形成 “训练 - 验证” 技术闭环,不断推动模型性能突破。通过 ewmbench 提供的精细化、多维度量化分析,研发团队可以精准定位 evac 在处理如 “多物体交互”“动态环境避障” 等复杂场景的潜在不足,从而进行更具针对性的优化。

据悉,evac 与 ewmbench 组合方案,已正式入选 agibot world challenge @ iros 2025 – world model 赛道的官方基线系统与评测标准。

活动推荐

6 月 27~28 日的 aicon 北京站将继续聚焦 ai 技术的前沿突破与产业落地,围绕 ai agent 构建、多模态应用、大模型推理性能优化、数据智能实践、ai 产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索 ai 应用的无限可能!

科技分类资讯推荐

小米玄戒O1相关谣言回应来了 - 天天要闻

小米玄戒O1相关谣言回应来了

上周,小米正式举行小米15周年战略新品发布会。这次活动中,小米自主研发设计的“玄戒”芯片正式亮相。据悉,玄戒O1旗舰处理器由小米自主研发设计,有着190亿晶体管,芯片面积109mm²,实验室安兔兔跑分突破300万。
科技金融:“扫一扫,千万到手” - 天天要闻

科技金融:“扫一扫,千万到手”

5月22日,“金鱼嘴·机构日”金沙江联合资本·AI+智能硬件专场在南京金鱼嘴基金大厦举行。参加路演的9家企业覆盖工业机器人、智慧城市、医疗健康设备等领域。今天,记者走进全国首个基金特色街区——南京金鱼嘴基金街区,源码资本、毅达资本、华映资本等知名机构的标识铺满一整面墙,另一面墙上则有清华大学、上海交通大学...
苹果iPhone 17 Pro Max - 厨师cook做到了! - 天天要闻

苹果iPhone 17 Pro Max - 厨师cook做到了!

苹果iPhone17系列塑料模型的第一个上手视频。这是接近最终的设计。iPhone17的外观将会是这样的。左边有三个摄像头,LED闪光灯、麦克风和骗子位于最右边的角落,可能是为了给独立显示面部识别腾出空间。这个音量键、电源键、操作键和无用的
安卓16对智能手机手电筒亮度将可调节 - 天天要闻

安卓16对智能手机手电筒亮度将可调节

安卓 16 QPR1 Beta 版推出,带来诸多精彩功能,未来版本可能还会有更惊艳的升级,其中一个可能就是 “手电筒亮度调节” 工具。也许很快,用户就能控制设备闪光灯的光强度了。谷歌为推出此功能筹备已久。
特朗普对苹果和三星说:要么在美国制造,要么支付25%的关税 - 天天要闻

特朗普对苹果和三星说:要么在美国制造,要么支付25%的关税

唐纳德・特朗普正力促苹果、三星等主要智能手机制造商,将面向美国市场的产品生产环节迁回美国。他警告说,若不照做,就会对其产品征收 25% 的进口关税。特朗普先是通过其 “真相社交” 平台发布了这一消息,后又在椭圆形办公室的简报会上重申了一遍。
小米重磅发布,又“史上最强”!收入、盈利均创历史新高!小米SU7系列交付新车75869辆,卢伟冰介绍小米AI布局 - 天天要闻

小米重磅发布,又“史上最强”!收入、盈利均创历史新高!小米SU7系列交付新车75869辆,卢伟冰介绍小米AI布局

每经编辑:陈柯名,黄胜5月27日晚间,小米集团公布财报,2025年第一季度,集团收入及盈利均再次创下历史新高。2025年第一季度,小米集团总收入为人民币1113亿元,创历史新高,同比增长47.4%。业务分部来看,2025年第一季度,手机×AIoT分部收入为人民币927亿元,同比增长22.8%,智能电动汽车及AI等创新业务分部收入为人民币...