很强!人形机器人VLA 驱动全身协同在智元得到验证,行走与操作同时完成

2025年12月18日10:02:03 科技 1619
很强!人形机器人VLA 驱动全身协同在智元得到验证,行走与操作同时完成 - 天天要闻很强!人形机器人VLA 驱动全身协同在智元得到验证,行走与操作同时完成 - 天天要闻很强!人形机器人VLA 驱动全身协同在智元得到验证,行走与操作同时完成 - 天天要闻

让人形机器人能够像人一样完成装箱、搬运、推车等移动操作任务,一直是人们对具身智能的期待。近日,来自香港大学、智元AGIBOT、复旦大学和上海创智学院的联合研究团队提出了WholeBodyVLA,一种面向真实世界的人形机器人全身Vision–Language–Action 框架。该工作基于智元灵犀X2研究发布,将VLA(视觉语言动作模型)扩展至双足人形机器人的全身控制,验证了其在全身移动操作任务中的可行性。

与原地操作相比,移动操作的难点不在于单一技能,而在于行走与操作必须在同一任务中长期、稳定地协同发生。围绕这一挑战,WholeBodyVLA 总结出限制移动操作发展的两个核心问题:真机数据稀缺和运动执行中的不稳定性。

很强!人形机器人VLA 驱动全身协同在智元得到验证,行走与操作同时完成 - 天天要闻

相比原地操作,人形机器人在移动操作任务中的数据采集要“贵”得多。往往需要不止一个数采员同时遥操机器人上半身进行操作、下半身完成行走,这通常只能通过混合方案实现(例如 VR 控制上半身、遥控器控制下半身),这种方式操作流程长、效率低;或者使用全身动捕系统,但价格高昂。

相比纯粹的操作,移动操作对运动精准性和稳定性的要求高的多,任何偏离都可能导致目标操作物体脱离相机视野和工作空间。即使VLA输出了正确的运动指令,下半身控制器仍然有概率执行失败,例如出现走歪、踉跄等现象。

很强!人形机器人VLA 驱动全身协同在智元得到验证,行走与操作同时完成 - 天天要闻

为了解决这些挑战,研究团队提出了WholeBodyVLA,并引入了两个关键创新:从人类视频中学习和面向移动操作的RL控制器。前者是WholeBodyVLA 通过从第一视角人类视频中学习移动与操作的潜在动作,操作相关的潜在动作则基于 AgiBot World 数据集进行建模,后者是通用连续运动控制目标简化为一组离散运动指令,仅保留移动操作必要的强化学习训练目标,从而显著提升了控制器在运动执行时的稳定性。

研究团队在 智元灵犀X2人形机器人上进行了大量真机实验验证,发现 WholeBodyVLA 具备大范围、长程移动操作任务,距离泛化性和操作泛化性,地形泛化性。总的来说,WholeBodyVLA 展示了 VLA 扩展到双足人形机器人自主全身控制的可行路径。

原标题:《很强!人形机器人VLA 驱动全身协同在智元得到验证,行走与操作同时完成》

栏目主编:戎兵 题图来源:均为受访者提供

来源:作者:文汇报 沈湫莎

科技分类资讯推荐

引领科技豪华MPV新风尚 第二代腾势D9西安车展亮相 - 天天要闻

引领科技豪华MPV新风尚 第二代腾势D9西安车展亮相

兼具宜商气度与家用温情的科技豪华旗舰MPV,第二代腾势D9迎来西安地区正式亮相。新车依托全球新能源MPV冠军底蕴,以第二代刀片电池、双阀云辇-C、天神之眼5.0智驾等核心技术全面升级,兼顾商务体面与家庭舒适,为西北高端用户带来一站式全能出行解决方案。
采购禁入!科华数据材料造假被拒门外 - 天天要闻

采购禁入!科华数据材料造假被拒门外

本报(chinatimes.net.cn)记者胡雅文 北京报道这家赶上AI算力风口的公司,因投标材料造假,被相关采购方列入禁入名单两年,其此前提出的复议申请也被正式驳回。相关采购平台近日发布公告,明确驳回科华数据股份有限公司(下称“科华数据”,002335.SZ)此前提交的复议申请。早在一年前,科华数据已被认定在“信息通信枢纽...
快评乐道L80:15万元级买大五座,这波值得冲? - 天天要闻

快评乐道L80:15万元级买大五座,这波值得冲?

日前,乐道L80正式发布并开启预售,其整车购买预售价为24.58万元起,租电购买预售价则低至15.98万元起。面对大型SUV市场“细分再细分”之竞争趋势,这款乐道年度重磅新车都有哪些优势?又能否成为“大五座SUV革新之作”?下面,圈哥就带大家全方位感受。
成都直击凯威德:纯电全尺寸SUV的张扬与大气 - 天天要闻

成都直击凯威德:纯电全尺寸SUV的张扬与大气

4月22日,凯迪拉克以奥斯卡级盛典规格,将上海保利大剧院点亮为璀璨舞台,在品牌代言人倪妮与全场嘉宾的共同见证下,凯迪拉克全尺寸纯电公路旗舰——凯威德耀然上市。新车共推出长续航四驱Pro、高性能四驱Ultra两款配置,官方售价区间为46.88万-50.88万元。