让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25

2025年04月01日13:10:30 科技 7706

龚泽颖 投稿

量子位 | 公众号 qbitai

机器人落地复杂场景,社交导航能力一定是避不开的关键一点。

先简单介绍下,社交导航 (socialnav,social navigation) 是指在人机共存的环境中,机器人在遵循社会规范的前提下执行导航任务。

就拿下图来说,机器人需导航至目标点,而目标恰好位于两名行人未来轨迹的交汇区域。

不仅要灵活避免潜在的碰撞风险,还需与行人保持合适的社交距离。

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

总而言之,社交导航该任务对视觉导航领域提出了独特挑战:

预建地图的方法难以适应人群密集的动态环境,而现有rl方法存在短视决策和依赖全局信息的问题。

近期,香港科技大学(广州)和香港科技大学联合提出了一种新算法,falcon

它通过将轨迹预测算法融入社交导航任务中,实现长期动态避障并提升导航性能。

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

社交导航的另一个重要挑战则是现有基准的真实性不足

如下所示,现有基准通常存在以下几方面的局限性:

  • 场景复杂性不足:仅关注机器人与人类的交互,而忽略场景本身复杂性。

  • 人类行为不自然:行人动作僵硬、运动模式失真,难以反映实际场景交互。

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

针对上述局限性,研究团队构建了两个新数据集——social-hm3d 和 social-mp3d,作为社交导航任务的新基准。

该项目论文已被icra 2025接收,同时已经挂上arxiv。

代码和模型权重可到github寻找。

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

falcon:集成轨迹预测辅助任务的强化学习框架

falcon算法框架由2个模块组成:

  1. 主策略网络 (mpn,main policy network)

  2. 时空预知模块 (spm,spatial-temporal precognition module)

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

主策略网络:让机器人学会“遵守规则”

模块一,主策略网络,这是falcon的“大脑”,负责指导机器人如何行动。

其核心是社会认知惩罚(scp,social cognition penalty)机制,通过设计专门的惩罚函数,避免机器人干扰人类未来轨迹,从而引导智能体规避碰撞风险并保持社交距离。

具体而言,falcon引入三个关键惩罚项:

  • 障碍物碰撞惩罚 :严厉惩罚机器人撞到静态障碍物或行人。

  • 人类接近惩罚:当机器人靠近行人时,随距离减小增加惩罚。

  • 轨迹阻碍惩罚:如果机器人干扰行人未来路径,则提前施加惩罚。

时空预知模块:让机器人学会“提前规划”

模块二,时空预知模块(spm),结合轨迹预测与多种社交感知辅助任务,显著增强了机器人对未来环境动态变化的预测能力。

其主要功能包括:

  • 人类数量估计:预测场景中有多少人,帮助评估环境复杂程度。

  • 当前位置跟踪:实时跟踪行人位置,快速响应变化。

  • 未来轨迹预测:预测未来几秒行人路径,提前规划避障。

关键在于,辅助任务仅在训练阶段使用

在推理阶段,机器人仅依赖主策略网络进行决策。

这种设计简化了推理过程,确保模型在实际应用中的高效性。

特意构建两个新的数据集

现有社交导航基准存在诸多不足,如场景过于简化、人类行为不自然等。

以下表格为现有的社交导航模拟器与数据集统计特性对比:

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

为弥补这些缺陷,研究人员构建了两个新数据集——social-hm3d和social-mp3d,具备以下优势:

  • 真实场景重建:基于高精度3d扫描,涵盖公寓、办公楼、商场等多种室内场景。

  • 自然人类行为:采用多目标导向的轨迹生成算法和orca动态避障模型,模拟人类行走、休息等自然行为。

  • 合理人群密度:根据场景面积动态调整人类数量,确保交互密度适中。

研究团队表示,这两个基准既平衡了人机交互的社交密度,同时也避免了过度拥挤。

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

这一基准为社交导航研究提供了更贴近真实场景的评估环境,并且支持推广到有人环境下的物体导航、图像导航等下游任务。

实验部分

在定量分析方面,实验表明,falcon在目标达成和社会合规方面表现出色:

其一是目标达成

在social-hm3d中达到55.15%的成功率和成功路径效率(spl,success weighted by path length)

即使在未训练过的social-mp3d数据集上,也能取得55.05%的成功率。

其二是社会合规

在保持社交距离和避免碰撞方面表现良好,达到接近90%的个人空间合规性(personal space compliance, psc)和接近42%的人机碰撞率。

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

定量结果表明,falcon不仅在已知环境中表现出色,还能有效适应未见过的复杂动态环境。

在定性分析方面,下图的定性结果展示了falcon在不同典型场景中的优越性——

第一个是人员跟随情境。

falcon通过预测行人未来轨迹,主动调整速度和路径,保持安全距离。

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

第二个是复杂交叉路口。

面对行人和静态障碍物同时存在的场景,falcon提前预测并规划出安全高效的路径。

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

第三个是正面接近情境。

传统的rl算法proximity-aware试图直接从行人面前穿过导致碰撞,falcon通过预测行人未来轨迹,提前调整路径并安全避开。

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

3个关键发现

各项实验后,团队有了三个关键发现:

发现1,未来感知算法优于以往实时感知算法。

静态路径规划算法(如a*)无法适应动态环境,而实时感知方法(如orca和proximity-aware)虽能被动避障,但仍存在延迟反应问题。

相比之下,falcon能够主动预测行人轨迹并提前调整路径,显著提升了安全性和效率。

发现2,辅助任务有助于提高性能,其中轨迹预测最重要。

下表展示了不同辅助任务对导航性能的影响。

其中轨迹预测(spm.traj)效果最为显著,成功率从40.94%提升至54.00%。

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

发现3,scp和spm相辅相成,改善性能并加快训练收敛。

下图图中为消融研究中的训练曲线。

可以观察到,具有spm和scp的完整falcon模型收敛更快,性能更好。

让机器人在人群穿梭自如,港科广&港科大突破社交导航盲区 | ICRA'25 - 天天要闻

scp在提升模型性能方面发挥关键作用,尤其是与spm集成后,整体性能进一步提升(从53.63%提高至55.15%),并加快训练收敛速度。

项目主页:https://zeying-gong.github.io/projects/falcon/论文链接:https://arxiv.org/abs/2409.13244代码链接:https://github.com/zeying-gong/falcon

科技分类资讯推荐

无线信号增强秘籍,桥接和中继模式哪个更强? - 天天要闻

无线信号增强秘籍,桥接和中继模式哪个更强?

【ZOL中关村在线原创技术解析】随着无线通信与计算机技术飞速发展,人们愈发渴望随时随地享受稳定的数据通信服务。无线路由器作为无线网络核心设备,作用关键。但当其信号覆盖不足,如穿过两堵墙后信号微弱时,可通过无线桥接或中继模式连接两个无线路由器,扩展网络、增强信号。中继模式和桥接模式虽都能扩展网络覆盖,但...
流畅更耐用 魅族Note 16将预装Flyme 12 - 天天要闻

流畅更耐用 魅族Note 16将预装Flyme 12

魅族官方透露,将于5月发布的魅族Note 16系列将出厂预装Flyme 12新系统,这也是Flyme系统大版本首次在非旗舰机型上首发。魅族Note 16搭载紫光展锐T765处理器,配备6.78英寸LCD屏,分辨率达2460*1080。后置采用八边形相机模组,由5000万像素主摄和200万像素镜头组成。续航方面,内置6600mAh大容量电池,支持40W有线充电
跨境电商迎“成本地震”,行业洗牌加速 - 天天要闻

跨境电商迎“成本地震”,行业洗牌加速

【环球网财经综合报道】近日,美国正式终止了对中国价值不超过800美元的小额包裹免征关税的政策,这一变化引发了中国跨境电商行业的连锁反应。多家物流公司随即调整策略,物流费用普遍上涨,并增加了高额预收税金。(图片来源:东方IC)美国的800美元小额免税政策(De Minimis)自2016年实施以来,极大地推动了全球跨境电商...
音乐节超时粉丝吵上热搜!罗云熙周深发布联合说明 - 天天要闻

音乐节超时粉丝吵上热搜!罗云熙周深发布联合说明

5月4日,太湖湾音乐节组委会“关于5月1日太湖湾音乐节的相关讨论”,联合罗云熙工作室、周深工作室作出如下说明:在演出过程中,现场因节奏调整产生变化,相关团队均已积极协作,确保了整体流程顺利完成。对于由此引发的相关关注,我们充分理解大家的关心
国外一公司推出“空中自行车”:可垂直起飞、极速200公里/时 - 天天要闻

国外一公司推出“空中自行车”:可垂直起飞、极速200公里/时

快科技5月5日消息,近日,国外一家名为Volonaut的新成立公司推出了一款 “空中自行车”,这是一款具有创新性和颠覆性的飞行载具。其由Jetson One(注:一款飞行器)创造者托马斯・帕坦(Tomasz Patan)在波兰研发,其设计灵感源自科幻电影,尤其是《星球大战》中的飞行摩托。外观上没有传统飞行器的冗余结构,仅见容纳推进...
全球首款双形态人形机器人正式发布! - 天天要闻

全球首款双形态人形机器人正式发布!

前言首次定义具身人形机器人商用范式。近日消息,全球首款双形态人形机器人——数字华夏IP系列开山之作星行侠P01正式发布。颜值高、智商高、易使用首次定义具身人形机器人商用范式据悉,数字华夏推出IP系列的初衷,是打造属于这个时代的“商用机器人”。“外形潮流时尚、智商情商兼具、使用维护极简,首次定义具身人形机...
三星One UI 8测试版或下月推出 给后续修复留出时间 - 天天要闻

三星One UI 8测试版或下月推出 给后续修复留出时间

【CNMO科技消息】三星已经开始内部测试全新的One UI 8系统,同时也在包括Galaxy Z Flip6在内的多款设备上进行适配测试。按照目前的进度来看,这次更新的到来时间可能比很多人预想得更早,有可能会在今年7月或8月之前就正式推出。 和以往一样,三星应该会先上线One UI 8的测试版计划,给部分用户提前尝鲜的机会。根据最新消...
苹果引入Anthropic开发的Claude AI系统 欲放弃自研? - 天天要闻

苹果引入Anthropic开发的Claude AI系统 欲放弃自研?

【CNMO科技消息】苹果最近开始引入Anthropic公司开发的Claude AI系统,用于协助其工程师更高效地编写代码。 长期以来,苹果一直坚持自主研发核心技术,很少依赖外部力量。但这一次,它选择与Anthropic合作,将后者的Claude Sonnet模型集成到自家开发工具Xcode的升级版本中。据彭博社报道,这项合作已经开始在内部落地,主要...
6 大升级!Apple Watch SE 3 入门款到底有多能打? - 天天要闻

6 大升级!Apple Watch SE 3 入门款到底有多能打?

文 | 路边同学还有 4 个月,苹果将推出新一代入门级智能手表 —— Apple Watch SE 3。这款原计划在 2024 年发布的机型,因市场节奏调整延后至今,却也让外界对其升级细节有了更充分的爆料空间。