Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到?

2025年06月13日16:50:20 科技 9197

鷺羽 發自 凹非寺

量子位 | 公眾號 qbitai

好傢夥,機械人進廠打工原視頻流出,整整60分鐘,完全未剪輯。

前幾天figure 02曬1分鐘物流分揀視頻,網友們完全沒看夠啊。

於是figure創始人立馬60分鐘進廠打工vlog(未刪減版)奉上。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

可靈活處理更多類型包裹,更接近人類水平的硬件運動,仔細看機械人在工作時,還會實時查看新數據來觀察學習。

可以很輕鬆地從一堆非結構化的雜亂對象中抽出包裹,並在推走一個包裹的同時,伸手去取另外一個包裹。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

短時間內整體性能飛速提升,到底發生了什麼?

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

剛剛官方同步釋出的完整技術解讀文檔來答疑解惑了。

受益於高質量演示數據集的擴展,以及對figure自研的helix神經網絡的視覺電機策略(visuo-motor policy)進行架構改進,機械人在高速工作負載下的穩定性得以長足發展。

另外通過啟動狀態感知和力感應,在不犧牲效率的情況下還全面增強了機械人的穩健性和適應性。

更多詳細技術細節如下。

數據擴展

將前後兩次視頻對比,物流任務明顯擴展至更多形態的包裹,除了標準的硬紙盒,現在還可以處理聚乙烯袋、信封和其它可摺疊、皺縮或彎曲的物品。

這讓機械人完成包裹反轉,並抓取和定位標籤的難度陡然提升。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

針對不同形態包裹,helix採取即時調整抓取策略解決,例如碰到紙盒就雙手上下一翻,碰到信封則一隻手扶住,另一隻手輕輕捏住邊緣翻轉。

值得注意的是,機械人還會輕輕拍打塑料包裝以撫平起皺的貨物條形碼,這是機械人自己從演示中學習到的自適應行為,側面凸顯出端到端學習的優勢。

儘管包裹的形狀質地都得以擴展,還有新動作的產生,但絲毫沒有影響工作效率。

實驗表明,增加訓練數據可以顯著提高吞吐量和準確性,在10到60小時中,包裹的平均處理速度約為4.05s,吞吐量提高了58%,條形碼成功率也從88.2%升至94.4%

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

總之,這些改進都表明了這是一個更加靈巧和可靠的系統,可以在廣泛的實際包裹中,更接近人類水平的速度和準確性。

架構改進

研究團隊對helix的視覺電機策略的架構進行了針對性改進,引入了新的內存和傳感模塊,能更好地幫助機械人感知環境變化。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

具體來說,可以分為視覺記憶狀態歷史力反饋三個部分:

  • 視覺記憶

helix配備了一個新的內存模塊,可以從系列視頻幀中組合特徵,再形成短期視覺記憶。

例如,在初始攝像機圖像中沒有完全顯示標籤,helix就可以調用前一時刻的圖像幀,並控制手部將包裹旋轉至標籤可見的記憶角度。

期間,機械人還可以記住它已經檢查過的包裝側面,避免重複檢查,提高成功率。

從本質上講,視覺記憶為helix提供了時間背景感,可以更有效地通過多次小型旋轉或視點調整來查找條形碼位置。

  • 狀態歷史

該策略在固定持續時間內的動作分塊(action chunk)中運行,也就是將連續動作序列分割為固定長度的小段進行規劃和執行。

首先會觀察當前狀態(手、軀幹和頭部)並輸出一小段運動軌跡,反覆重新觀察多次後,再將全部狀態合併輸入,以確保模塊間的連續性。

由於狀態歷史記錄保留了上下文,即使重新規劃或面對干擾,機械人仍能保持穩健,例如當包裹抓取失敗時,helix會以最小的延遲迅速糾正運動,顯著縮短了處理時間。

  • 力反饋

為了賦予helix觸感,機械人施加在環境和目標上的力,被反饋送至神經網絡狀態輸入中,以幫助機械人動態調整運動過程,例如當它檢測到與傳送帶接觸時,會暫停向下繼續運動。

通過一個閉合迴路,helix可以實現更精準的控制,提高運動的成功率和一致性,也更能適應不同形態重量的物流包裹。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

在啟用新策略後,條形碼定向朝下的成功率提高到94%,平均處理時間降至4.05s,同時精度保持在92%以上。

另外,figure 02除了可以完成自主分揀,其端對端模型還可以輕鬆建立人機交互

無需單獨的程序或模式開關,僅通過神經網絡的視覺調節,當站在一旁的人類伸出手,機械人就會自動認定這是交出物品的提示,並將包裹遞交給人類而不是傳送帶。

這反映了helix神經網絡的靈活性,只需少量演示,即可學習新的上下文相關行為。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

one more thing

視頻一出,figure創始人的評論區就炸開了鍋。

有網友樂見其成,讚歎figure不搞demo,直接放一小時視頻的自信。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

有網友看到機械人參與物流工作帶來的效率和成本考量。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

自然也少不了老生常談的話題:人類怎樣才能避免被機械人取代?

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

也有技術宅思考為什麼物流機械人一定要仿人類外型,三頭六臂似乎效率更高。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

當然也少不了拿放大鏡看視頻的樂子人,致力於找機械人的茬。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

也歡迎大家一起來找茬,或者在本評論區留下你的真知灼見。

參考鏈接:

[1]https://www.figure.ai/news/scaling-helix-logistics

[2]https://www.figure.ai/news/helix

[3]https://www.figure.ai/news/helix-logistics

[4]https://x.com/adcock_brett/status/1931391783306678515

科技分類資訊推薦

90年代的前瞻之作:日產R'nessa技術創新回顧 - 天天要聞

90年代的前瞻之作:日產R'nessa技術創新回顧

日產R'nessa是日產汽車公司在1997年推出的一款旅行車型,雖然在市場上的存在時間相對較短,但其獨特的設計理念和技術創新卻為汽車史留下了值得銘記的一頁。作為日產在20世紀90年代探索多元化車型布局的重要產品,R'nessa承載着日產對家用旅行車市場的獨特理
應對AI時代挑戰 微軟、OpenAI等牽頭建立教師培訓學院 - 天天要聞

應對AI時代挑戰 微軟、OpenAI等牽頭建立教師培訓學院

財聯社7月9日訊(編輯 趙昊)當地時間周二(7月8日),美國教師聯盟(AFT)在官網宣布,將攜手美國教師聯合會、微軟、OpenAI和Anthropic合作成立一個全新的培訓中心。該培訓中心名為「National Academy for AI Teaching」(國家人工智能教學學院),旨在幫助美國各地的教育工作者在課堂上運用人工智能(AI)工具。新聞稿寫..
小心拼多多廣告自動騙扣你的錢 - 天天要聞

小心拼多多廣告自動騙扣你的錢

筆者經常在網絡上購物,對於一些購物廣告也時常點擊看一下,遇到合適的商品也會下單。過去,筆者在手機上設置了識臉支付和指紋支付,後來發現,識臉支付和指紋指紋經常發生誤支付的情況,便取消了這兩種支付手段,很多購網購者也都因為這個原因取消了這兩種支
吃土半年就為換套智能鎖,結果還被坑了:智能鎖牢記「5不選」 - 天天要聞

吃土半年就為換套智能鎖,結果還被坑了:智能鎖牢記「5不選」

攢了大半年錢換智能鎖,結果用起來各種糟心,這事誰遇上都得憋屈。門鎖是家的第一道防線,選錯了可不只是花錢打水漂,搞不好連安全感都搭進去。市面上那些花里胡哨的功能,聽着高級用着雞肋,白白掏空錢包還添堵。先說指紋識別,光學款看着方便實際漏洞百出,
被誤解的Linux:我們錯過的,遠不止一個系統 - 天天要聞

被誤解的Linux:我們錯過的,遠不止一個系統

提到電腦系統,你的第一反應是不是Windows?頂多,再加一個蘋果的macOS。  但如果我說出「Linux」這個詞,你腦海里浮現的,恐怕就是一串串滾動的綠色代碼,和一個戴着眼鏡、在昏暗房間里埋頭敲鍵盤的「大神」形象吧?
擬入主688585,智元機械人要來A股了!公司聯合創始人曾是華為「天才少年」 - 天天要聞

擬入主688585,智元機械人要來A股了!公司聯合創始人曾是華為「天才少年」

7月8日,上緯新材(688585.SH,股價7.78元,市值31.38億元)發佈公告稱,智元機械人擬至少收購其63.62%股份。待本次股權交易完成後,上緯新材控股股東將變更為智元機械人及其管理團隊共同持股的主體,實際控制人將變更為鄧泰華,核心團隊包括稚暉君等。 本次交易如成功落地,有望成為國九條和併購六條實施以來,新質生產力...
天融信WAAP助力應用安全升級,護航大模型應用落地 - 天天要聞

天融信WAAP助力應用安全升級,護航大模型應用落地

在雲原生架構、微服務技術普及及移動應用深度滲透的當下,Web業務部署與管理模式正被系統性重塑。應用交互流量增長、API端點激增、BOT攻擊上升,大模型還顛覆了Web攻防規則,Web暴露面急劇擴張,應用層安全風險持續升級。天融信WAAP作為新一代應用安全解決方案,以WAF技術為核心,融合API安全、BOT攻擊管理、抗DDoS防護等技...