今年4月勇奪全球首個人形機器人“半馬”冠軍的“天工”,面向行業免費開放了其在運動控制上的核心技術。近日,北京人形機器人創新中心發布了開源運動控制框架Tien Kung-Lab,其中就包括“天工”的奔跑秘笈。

如同人類需要穩健行走才能勞動,強大的運動控制能力是人形機器人執行各類產業任務的前提。運動控制相當於人類小腦發揮的作用,也是人形機器人從實驗室邁向規模化應用的重要門檻。“天工”之所以能以2時40分42秒跑完21.0975公里,就得益於運動控制的核心技術。
與傳統人形機器人運動控制採取的動力學方法、強化學習兩條路都不同,“天工”採用的是北京人形機器人創新中心研發的“強化模仿學習”新法子:先“吸收”人類運動過程中關節變化等各種數據並進行模仿,再在仿真環境中邊跑邊成長,在摸索和試錯中學習。
這一方法首次融合了模仿學習與強化學習的優勢,讓人形機器人在走路、跑步等移動中面對複雜地形的穩定性更高、適應能力更強,還保留了與人類高度相似的優雅姿態。

Tien Kung-Lab是一套開源強化學習運動控制算法框架。該框架融合前沿的強化學習技術和人體運動數據,能讓人形機器人實現自然、高效、穩定的運動控制。為了幫助開發者更方便感知策略訓練,此次開源的算法框架,改進了相關的光線追蹤技術,實現了訓練環境中深度圖和激光雷達點雲的快速準確獲取,讓仿真環境下從感知到運動的“端到端”訓練成為可能。
自去年4月首度亮相,“天工”的運動控制算法不斷迭代,今年還基於視覺的感知行走,完成了全球首例百級台階攀登實驗,實現了無磕碰、不踩棱、不踏空地跨越連續多級樓梯和35厘米大高差台階,奔跑時速也由6公里/小時提高至12公里/小時,並能在雪地等高難度地形中高速奔跑。
人形機器人馬拉松比賽中,更是讓Tien Kung-Lab經歷了超長賽程和真實路況的挑戰,在運動控制層面保證了“天工Ultra”每一次邁步與落地的穩定、準確,跨越了真實道路中凸起、凹陷、減速帶、細小石子等隨機干擾,最終實現了順利完賽。
“天工”運控算法面向行業開源,填補了高性能人形機器人運動控制框架在開源領域的空白,將縮短其他人形機器人跨地形高速泛化移動的開發周期。
“開源之後,其他的開發者就可以根據自己的需求進行二次開發。”北京人形機器人創新中心開源社區負責人董建宇解釋了“天工”之所以技術開源的原因:開源之後,天工的運動控制技術就可以在不同開發者的場景里進行訓練,適應更複雜的地形,完成更複雜的動作和任務;眾多開發者加入進來,也能加速天工運動控制算法在工業場景、物流場景、特種作業場景等高複雜環境下規模化應用。按照開源社區的協議,其他開發者也會將二次開發的代碼反哺給社區,共同擴大人形機器人的技術生態。
運動控制的秘笈向行業開放後,其他人形機器人是否會“追”上“天工”?
“天工的運動控制能力會不斷升級和迭代。開源之後,我們收到更真實的一線反饋,看到真實場景里的更多需求,倒逼着天工不斷進行技術創新和突破,不斷實現技術上的領先。”董建宇說,天工的運動控制框架也會隨着技術的迭代,不斷開源新的版本。
當前,Tien Kung-Lab已在Open X-Humanoid開源社區、Github、Gitee等平台開放下載。
來源:北京日報客戶端
記者:曹政