讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25

2025年04月01日13:10:30 科技 7706

龔澤穎 投稿

量子位 | 公眾號 qbitai

機械人落地複雜場景,社交導航能力一定是避不開的關鍵一點。

先簡單介紹下,社交導航 (socialnav,social navigation) 是指在人機共存的環境中,機械人在遵循社會規範的前提下執行導航任務。

就拿下圖來說,機械人需導航至目標點,而目標恰好位於兩名行人未來軌跡的交匯區域。

不僅要靈活避免潛在的碰撞風險,還需與行人保持合適的社交距離。

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

總而言之,社交導航該任務對視覺導航領域提出了獨特挑戰:

預建地圖的方法難以適應人群密集的動態環境,而現有rl方法存在短視決策和依賴全局信息的問題。

近期,香港科技大學(廣州)和香港科技大學聯合提出了一種新算法,falcon

它通過將軌跡預測算法融入社交導航任務中,實現長期動態避障並提升導航性能。

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

社交導航的另一個重要挑戰則是現有基準的真實性不足

如下所示,現有基準通常存在以下幾方面的局限性:

  • 場景複雜性不足:僅關注機械人與人類的交互,而忽略場景本身複雜性。

  • 人類行為不自然:行人動作僵硬、運動模式失真,難以反映實際場景交互。

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

針對上述局限性,研究團隊構建了兩個新數據集——social-hm3d 和 social-mp3d,作為社交導航任務的新基準。

該項目論文已被icra 2025接收,同時已經掛上arxiv。

代碼和模型權重可到github尋找。

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

falcon:集成軌跡預測輔助任務的強化學習框架

falcon算法框架由2個模塊組成:

  1. 主策略網絡 (mpn,main policy network)

  2. 時空預知模塊 (spm,spatial-temporal precognition module)

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

主策略網絡:讓機械人學會「遵守規則」

模塊一,主策略網絡,這是falcon的「大腦」,負責指導機械人如何行動。

其核心是社會認知懲罰(scp,social cognition penalty)機制,通過設計專門的懲罰函數,避免機械人干擾人類未來軌跡,從而引導智能體規避碰撞風險並保持社交距離。

具體而言,falcon引入三個關鍵懲罰項:

  • 障礙物碰撞懲罰 :嚴厲懲罰機械人撞到靜態障礙物或行人。

  • 人類接近懲罰:當機械人靠近行人時,隨距離減小增加懲罰。

  • 軌跡阻礙懲罰:如果機械人干擾行人未來路徑,則提前施加懲罰。

時空預知模塊:讓機械人學會「提前規劃」

模塊二,時空預知模塊(spm),結合軌跡預測與多種社交感知輔助任務,顯著增強了機械人對未來環境動態變化的預測能力。

其主要功能包括:

  • 人類數量估計:預測場景中有多少人,幫助評估環境複雜程度。

  • 當前位置跟蹤:實時跟蹤行人位置,快速響應變化。

  • 未來軌跡預測:預測未來幾秒行人路徑,提前規劃避障。

關鍵在於,輔助任務僅在訓練階段使用

在推理階段,機械人僅依賴主策略網絡進行決策。

這種設計簡化了推理過程,確保模型在實際應用中的高效性。

特意構建兩個新的數據集

現有社交導航基準存在諸多不足,如場景過於簡化、人類行為不自然等。

以下表格為現有的社交導航模擬器與數據集統計特性對比:

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

為彌補這些缺陷,研究人員構建了兩個新數據集——social-hm3d和social-mp3d,具備以下優勢:

  • 真實場景重建:基於高精度3d掃描,涵蓋公寓、辦公樓、商場等多種室內場景。

  • 自然人類行為:採用多目標導向的軌跡生成算法和orca動態避障模型,模擬人類行走、休息等自然行為。

  • 合理人群密度:根據場景面積動態調整人類數量,確保交互密度適中。

研究團隊表示,這兩個基準既平衡了人機交互的社交密度,同時也避免了過度擁擠。

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

這一基準為社交導航研究提供了更貼近真實場景的評估環境,並且支持推廣到有人環境下的物體導航、圖像導航等下游任務。

實驗部分

在定量分析方面,實驗表明,falcon在目標達成和社會合規方面表現出色:

其一是目標達成

在social-hm3d中達到55.15%的成功率和成功路徑效率(spl,success weighted by path length)

即使在未訓練過的social-mp3d數據集上,也能取得55.05%的成功率。

其二是社會合規

在保持社交距離和避免碰撞方面表現良好,達到接近90%的個人空間合規性(personal space compliance, psc)和接近42%的人機碰撞率。

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

定量結果表明,falcon不僅在已知環境中表現出色,還能有效適應未見過的複雜動態環境。

在定性分析方面,下圖的定性結果展示了falcon在不同典型場景中的優越性——

第一個是人員跟隨情境。

falcon通過預測行人未來軌跡,主動調整速度和路徑,保持安全距離。

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

第二個是複雜交叉路口。

面對行人和靜態障礙物同時存在的場景,falcon提前預測並規划出安全高效的路徑。

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

第三個是正面接近情境。

傳統的rl算法proximity-aware試圖直接從行人面前穿過導致碰撞,falcon通過預測行人未來軌跡,提前調整路徑並安全避開。

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

3個關鍵發現

各項實驗後,團隊有了三個關鍵發現:

發現1,未來感知算法優於以往實時感知算法。

靜態路徑規划算法(如a*)無法適應動態環境,而實時感知方法(如orca和proximity-aware)雖能被動避障,但仍存在延遲反應問題。

相比之下,falcon能夠主動預測行人軌跡並提前調整路徑,顯著提升了安全性和效率。

發現2,輔助任務有助於提高性能,其中軌跡預測最重要。

下表展示了不同輔助任務對導航性能的影響。

其中軌跡預測(spm.traj)效果最為顯著,成功率從40.94%提升至54.00%。

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

發現3,scp和spm相輔相成,改善性能並加快訓練收斂。

下圖圖中為消融研究中的訓練曲線。

可以觀察到,具有spm和scp的完整falcon模型收斂更快,性能更好。

讓機械人在人群穿梭自如,港科廣&港科大突破社交導航盲區 | ICRA'25 - 天天要聞

scp在提升模型性能方面發揮關鍵作用,尤其是與spm集成後,整體性能進一步提升(從53.63%提高至55.15%),並加快訓練收斂速度。

項目主頁:https://zeying-gong.github.io/projects/falcon/論文鏈接:https://arxiv.org/abs/2409.13244代碼鏈接:https://github.com/zeying-gong/falcon

科技分類資訊推薦

無線信號增強秘籍,橋接和中繼模式哪個更強? - 天天要聞

無線信號增強秘籍,橋接和中繼模式哪個更強?

【ZOL中關村在線原創技術解析】隨着無線通信與計算機技術飛速發展,人們愈發渴望隨時隨地享受穩定的數據通信服務。無線路由器作為無線網絡核心設備,作用關鍵。但當其信號覆蓋不足,如穿過兩堵牆後信號微弱時,可通過無線橋接或中繼模式連接兩個無線路由器,擴展網絡、增強信號。中繼模式和橋接模式雖都能擴展網絡覆蓋,但...
流暢更耐用 魅族Note 16將預裝Flyme 12 - 天天要聞

流暢更耐用 魅族Note 16將預裝Flyme 12

魅族官方透露,將於5月發佈的魅族Note 16系列將出廠預裝Flyme 12新系統,這也是Flyme系統大版本首次在非旗艦機型上首發。魅族Note 16搭載紫光展銳T765處理器,配備6.78英寸LCD屏,分辨率達2460*1080。後置採用八邊形相機模組,由5000萬像素主攝和200萬像素鏡頭組成。續航方面,內置6600mAh大容量電池,支持40W有線充電
跨境電商迎「成本地震」,行業洗牌加速 - 天天要聞

跨境電商迎「成本地震」,行業洗牌加速

【環球網財經綜合報道】近日,美國正式終止了對中國價值不超過800美元的小額包裹免徵關稅的政策,這一變化引發了中國跨境電商行業的連鎖反應。多家物流公司隨即調整策略,物流費用普遍上漲,並增加了高額預收稅金。(圖片來源:東方IC)美國的800美元小額免稅政策(De Minimis)自2016年實施以來,極大地推動了全球跨境電商...
音樂節超時粉絲吵上熱搜!羅雲熙周深發佈聯合說明 - 天天要聞

音樂節超時粉絲吵上熱搜!羅雲熙周深發佈聯合說明

5月4日,太湖灣音樂節組委會「關於5月1日太湖灣音樂節的相關討論」,聯合羅雲熙工作室、周深工作室作出如下說明:在演出過程中,現場因節奏調整產生變化,相關團隊均已積極協作,確保了整體流程順利完成。對於由此引發的相關關注,我們充分理解大家的關心
國外一公司推出「空中單車」:可垂直起飛、極速200公里/時 - 天天要聞

國外一公司推出「空中單車」:可垂直起飛、極速200公里/時

快科技5月5日消息,近日,國外一家名為Volonaut的新成立公司推出了一款 「空中單車」,這是一款具有創新性和顛覆性的飛行載具。其由Jetson One(註:一款飛行器)創造者托馬斯・帕坦(Tomasz Patan)在波蘭研發,其設計靈感源自科幻電影,尤其是《星球大戰》中的飛行摩托。外觀上沒有傳統飛行器的冗餘結構,僅見容納推進...
全球首款雙形態人形機械人正式發佈! - 天天要聞

全球首款雙形態人形機械人正式發佈!

前言首次定義具身人形機械人商用範式。近日消息,全球首款雙形態人形機械人——數字華夏IP系列開山之作星行俠P01正式發佈。顏值高、智商高、易使用首次定義具身人形機械人商用範式據悉,數字華夏推出IP系列的初衷,是打造屬於這個時代的「商用機械人」。「外形潮流時尚、智商情商兼具、使用維護極簡,首次定義具身人形機...
三星One UI 8測試版或下月推出 給後續修復留出時間 - 天天要聞

三星One UI 8測試版或下月推出 給後續修復留出時間

【CNMO科技消息】三星已經開始內部測試全新的One UI 8系統,同時也在包括Galaxy Z Flip6在內的多款設備上進行適配測試。按照目前的進度來看,這次更新的到來時間可能比很多人預想得更早,有可能會在今年7月或8月之前就正式推出。 和以往一樣,三星應該會先上線One UI 8的測試版計劃,給部分用戶提前嘗鮮的機會。根據最新消...
蘋果引入Anthropic開發的Claude AI系統 欲放棄自研? - 天天要聞

蘋果引入Anthropic開發的Claude AI系統 欲放棄自研?

【CNMO科技消息】蘋果最近開始引入Anthropic公司開發的Claude AI系統,用於協助其工程師更高效地編寫代碼。 長期以來,蘋果一直堅持自主研發核心技術,很少依賴外部力量。但這一次,它選擇與Anthropic合作,將後者的Claude Sonnet模型集成到自家開發工具Xcode的升級版本中。據彭博社報道,這項合作已經開始在內部落地,主要...
6 大升級!Apple Watch SE 3 入門款到底有多能打? - 天天要聞

6 大升級!Apple Watch SE 3 入門款到底有多能打?

文 | 路邊同學還有 4 個月,蘋果將推出新一代入門級智能手錶 —— Apple Watch SE 3。這款原計劃在 2024 年發佈的機型,因市場節奏調整延後至今,卻也讓外界對其升級細節有了更充分的爆料空間。