智元机器人发布并开源首个机器人动作序列驱动的世界模型

2025年05月26日15:20:13 科技 8722
智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
作者 | 褚杏娟

近日,智元机器人重磅发布具身智能领域双重里程碑式突破:全球首个基于机器人动作序列驱动的具身世界模型 evac (enerverse-ac),以及具身世界模型评测基准 ewmbench。这两大创新成果现已全面开源,旨在构建“低成本模拟 - 标准化评测 - 高效迭代”的全新开发范式,持续赋能全球具身智能研究,加速技术落地与产业发展。

evac arxiv:https://arxiv.org/abs/2505.09723

evac 开源代码:https://github.com/agibottech/enerverse-ac

ewmbench arxiv: https://arxiv.org/abs/2505.09694

ewmbench 开源代码:https://github.com/agibottech/ewmbench

当前具身智能演进面临两大关键制约:在测试阶段,真机验证代价大、风险高,仿真系统又受制于虚实偏差;在数据层面,海量真机数据尚未构建基于轨迹扩增的高效利用机制,限制了多样性生成与泛化训练。为打破困局,智元机器人在去年发布的世界模型架构 enerverse 基础上推出创新成果:基于动作序列驱动的世界模型 evac 与具身世界模型评测榜单 ewmbench,构建从训练到评测全链路技术闭环,重新定义具身世界模型研发范式。

全球首个机器人动作序列驱动的世界模型

evac 是一个能够动态复现机器人与环境复杂交互的世界模型,标志着从传统仿真到生成式模拟的跃迁。

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
核心能力:从 “物理执行” 到“像素空间”的精准映射

evac 基于前序工作 enerverse 架构持续演进,创新型引入多级动作条件注入机制,实现 “物理动作 - 视觉动态” 的端到端生成,其核心能力体现在以下几个方面:

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
  • 机器人动作与像素的高精度对齐:将机械臂 6d 位姿(x,y,z,roll,pitch,yaw)与末端执行器行程投影为 action map,确保物理动作与图像帧的像素级对齐,精准建模 “抓取”、“放置”、“碰撞”、“推拉”、“快速抛掷”、“缓慢摇晃” 等复杂动力学行为;
  • 动态多视图建模:引入 ray map 编码相机运动轨迹,支持头部 、腕部等多视角协同生成一致且连贯的视觉场景,赋予机器人更全面的环境生成能力。;
  • 卓越的长时序一致性:采用 chunk-wise 自回归扩散架构与稀疏记忆机制(sparse memory),evac 能够实现单视图稳定生成长达 30 个连续片段、多视图下亦可维持 10 个连续片段的无漂移稳定输出,保证了模拟过程在时间轴上的连贯性与真实性;
  • 数据高效利用:融合 agibot-world 数据集 + 失败轨迹(如抓取滑脱、路径碰撞)提升生成质量,该策略能有效抑制幻觉现象,使模型能更合理、更全面地建模机器人与环境的交互动态。
生成式仿真评估 + 数据引擎双轮驱动
智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
  • 生成式仿真评测

针对真机评测成本高、风险大、难以复现等痛点,evac 开创性地提出了生成式模拟评测方案,它能与待评测的策略模型进行交替推理,构建起一套完整的交互式评测管线。实验显示,在多个任务中,evac 所生成的评测结果与真机评测的成功率具有高度一致性,甚至能够可靠地识别出性能更优的模型权重,大幅提升了策略模型的筛选效率。

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
  • 数据增广引擎

evac 能够基于极少量的专家轨迹数据,通过动作插值与高保真画面生成技术进行大规模数据增广。应用结果表明,采用 evac 数据增广数据训练的策略模型,其任务成功率提升高达 29%,目标跟随性得到显著改善,验证了这一方案在具身智能研究中的实用性与高性价比。

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
打造具身世界模型的 “质检尺”

为了科学、系统地衡量具身世界模型的性能表现,智元机器人推出了全球首个具身世界模型评测基准——ewmbench,旨在填补行业空白,构建统一、可信的评测标准。

智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
三维度评估体系:场景 × 动作 × 语义的立体考核

针对机器人操作场景的复杂性与特殊性,ewmbench 构建了立体化的评估体系,从场景一致性、动作合理性 与 语义对齐与多样性 三大核心指标进行分析:

  • 场景一致性 scene consistency,评估生成场景中背景 / 物体 / 视角等稳固度与真实性,采用微调过的 dinov2 特征进行量化。
  • 动作合理性 motion correctness,利用 hsd (symmetric hausdorff distance), ndtw (normalized dynamic time warping) 和 dynamics score 三重互补指标协同精确评估生成动作的合理性与动力学真实度。
  • 语义对齐与多样性 semantic alignment & diversity,结合 mllm(多模态大模型)和 clip 从全局指令对齐度、关键步骤语义准确性、逻辑合理性等多个层次对生成视频进行语义理解评估。
智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻
权威数据支撑与便捷开源工具
  • 基准数据集:ewmbench 基于行业领先的开源百万真机数据集 agibot world 构建,涵盖了家居、工业、医疗三大场景的 10 类典型机器人操作任务和刚体 / 柔体 / 流体 / 关节物体等多种交互对象,其中包含超过 300 个精心设计的测试样本及 30% 挑战性场景(低光照 / 部分遮挡),全面验证模型在复杂环境下的鲁棒性。
  • 开源评测工具:智元机器人同步开源了全流程评测工具,支持一键生成标准化对比报告,大幅降低评估门槛,方便研究者快速开展模型比较与性能分析,加速实验验证与成果复现。
卓越评测性能:更贴近人类主观感知
智元机器人发布并开源首个机器人动作序列驱动的世界模型 - 天天要闻

相较于当前主流视频生成评测基准 vbench,ewmbench 在评测结果与人类主观判断的一致性方面表现更优,能够更真实、细致地反映具身世界模型在交互理解、动作还原与视觉一致性等核心维度的实际能力。

enerverse 作为强大的世界模型基础架构,为 evac 提供可靠的基础框架与预训练能力,而 evac 生成的多样化高质量数据又能反哺 enerverse 模型的持续优化,二者形成 “训练 - 验证” 技术闭环,不断推动模型性能突破。通过 ewmbench 提供的精细化、多维度量化分析,研发团队可以精准定位 evac 在处理如 “多物体交互”“动态环境避障” 等复杂场景的潜在不足,从而进行更具针对性的优化。

据悉,evac 与 ewmbench 组合方案,已正式入选 agibot world challenge @ iros 2025 – world model 赛道的官方基线系统与评测标准。

活动推荐

6 月 27~28 日的 aicon 北京站将继续聚焦 ai 技术的前沿突破与产业落地,围绕 ai agent 构建、多模态应用、大模型推理性能优化、数据智能实践、ai 产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索 ai 应用的无限可能!

科技分类资讯推荐

荣耀400系列配置曝光,5月28日发布 - 天天要闻

荣耀400系列配置曝光,5月28日发布

5 月 28 日,荣耀400 系列手机即将发布,官方表示这次的新品将在性能、影像和续航这三大核心领域带来突破性创新,成就科技与美学的巅峰之作。微博数码博主@数码闲聊站 也曝光了荣耀400 系列的配置信息:全系采用 6.55 英寸 1.5K 120Hz 直屏,支持 3840Hz 调光、金属边框设计。影像上全系配备 2 亿像素大底主摄、1200 万像素...
可灵Q1营收1.5亿元超预期 快手:AI将成第二增长曲线 - 天天要闻

可灵Q1营收1.5亿元超预期 快手:AI将成第二增长曲线

【TechWeb】5月27日,快手发布2025年第一季度财报,AI成为一大亮点。财报显示,本季度可灵AI商业化加速落地,营收超过1.5亿元。上个季度,快手披露,自商业化以来截至2025年2月,可灵AI累计营业收入超1亿元。快手创始人兼CEO程一笑直言,可灵AI营收超预期。关于大众关心的可灵AI主要的增长驱动因素、后续的增长策略,以及加...
全能生产力应用 Notion 登陆微软应用商店:最低要求 8GB 内存 - 天天要闻

全能生产力应用 Notion 登陆微软应用商店:最低要求 8GB 内存

IT之家 5 月 28 日消息,生产力工具 Notion 现已正式登陆 Microsoft Store,Windows PC 用户可以下载使用。微软在 Build 2025 开发者大会上,宣布这款集笔记、项目管理、协作等多功能于一身的应用将很快入驻其应用商店。时隔几天,该应用已经上架微软应用商店,官方要求为 Windows 10 21H2 及更高版本,以及至
过去5年里,苹果App Store阻止了超过90亿美元欺诈交易 - 天天要闻

过去5年里,苹果App Store阻止了超过90亿美元欺诈交易

2008 年问世以来,App Store 一直为用户提供安全可靠的平台,并为开发者提供富有活力的市场,助其在全球各地发展业务。Apple 年度 App Store 欺诈分析报告显示,在过去五年里,App Store 累计阻止了超过 90 亿美元欺诈交易,其中仅 2024 年阻止的金额就超过了 20 亿美元,为用户提供保护。这彰显了 App Store 的持续
液冷板钎焊石墨模具在哪些方面应用广泛? - 天天要闻

液冷板钎焊石墨模具在哪些方面应用广泛?

液冷板钎焊石墨模具在新能源汽车、数据中心、电子半导体及航空航天等领域应用广泛,以下为具体分析:新能源汽车领域:动力电池系统对散热和安全性要求极高,液冷板钎焊石墨模具通过石墨模具的高导热性结合钎焊工艺的密封性,可实现高效散热和可靠连接,确保电
卢伟冰:玄戒只做旗舰 与联发科高通长期并存 - 天天要闻

卢伟冰:玄戒只做旗舰 与联发科高通长期并存

在小米公布2025年Q1季度财报过后,小米方面也举行了业绩电话会议。小米集团总裁卢伟冰在回答有关玄戒芯片的诸多问题。 卢伟冰称,现阶段的玄戒芯片,将全力去做到预期水准,暂不考虑用于非旗舰系....
中欧半导体上下游企业座谈会在京召开 - 天天要闻

中欧半导体上下游企业座谈会在京召开

新京报讯 据商务部消息,5月27日,中欧半导体上下游企业座谈会在北京召开。商务部相关司局、中国半导体行业协会、中国欧盟商会及40余家中欧半导体上下游企业代表参会。会议就深化中欧半导体领域经贸合作进行交流。会议强调,中欧在全球半导体供应链中均占据重要地位,加强合作符合双方利益。当前国际形势复杂严峻,不稳定不...
交通领域人工智能发展顶层设计将出 - 天天要闻

交通领域人工智能发展顶层设计将出

政策速递 经济观察网讯在5月27日中国港口协会主办的港口科技创新大会上,交通运输部科技司创新发展处副处长赵晓辉透露,交通运输部正全力推动“人工智能+交通运输”行动。其中,顶层设计《“人工智能+交通运输”实施意见》(下称《实施意见》)已完成征求意见工作,将加快出台。《实施意见》明确到2030年,人工智能深入交通...