6月1日,北京海淀科技企業銀河通用推出自主研發導航大模型trackvla,標誌着機械人在複雜動態環境中的自主導航跟隨能力邁入了新的階段。
北京青年報記者了解到,這款具備純視覺環境感知、語言指令驅動、可自主推理及零樣本泛化能力的具身大模型,讓機械人從科幻電影中的想像逐漸走進現實生活。
trackvla的核心在於其「端到端」的設計理念,即模型能夠直接從「看到的圖像」和「聽到的指令」中推理出「怎麼走」,無需人為拆分多個步驟。這一特性使得trackvla在處理複雜導航任務時表現出色,無需提前構建環境地圖,即可在不同環境中實現自主導航。即便是面對未見過的商場、電梯、遊樂區等場景,trackvla也能依靠內嵌的環境理解知識實現「現學現走」。
在具體功能上,trackvla展現了八大核心能力。它能夠準確理解自然語言指令,實現目標的識別與跟蹤;在人流密集的環境中,也能準確識別並長時自主跟隨目標;若目標走出視野,它能通過空間智能和大模型推理能力重新找回目標;同時,trackvla還能在不依賴額外採集訓練數據的情況下,直接部署在陌生環境中實現長時穩定自主跟隨。此外,它還具備靈活避障、適應複雜場景等特點。通過app,用戶還可以實現遠程可視守護,實時掌握家人動態。
值得一提的是,trackvla不僅穩定跟隨人類,還能泛化至任意移動目標,如機器狗跟隨路上偶遇的動物狗狗,這一能力是訓練時並未教授的,展現了其強大的泛化能力。
銀河通用相關負責人表示,trackvla的推出不僅是前沿技術的突破,更是推進「通用具身智能機械人」落地過程中的重要一步。未來,trackvla將賦能不同形態的機械人本體,打造更加多樣化的產業生態和社會服務。
文/北京青年報記者 王斌
編輯/汪浩舟