Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到?

2025年06月13日16:50:20 科技 9197

鷺羽 發自 凹非寺

量子位 | 公眾號 qbitai

好傢夥,機械人進廠打工原視頻流出,整整60分鐘,完全未剪輯。

前幾天figure 02曬1分鐘物流分揀視頻,網友們完全沒看夠啊。

於是figure創始人立馬60分鐘進廠打工vlog(未刪減版)奉上。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

可靈活處理更多類型包裹,更接近人類水平的硬件運動,仔細看機械人在工作時,還會實時查看新數據來觀察學習。

可以很輕鬆地從一堆非結構化的雜亂對象中抽出包裹,並在推走一個包裹的同時,伸手去取另外一個包裹。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

短時間內整體性能飛速提升,到底發生了什麼?

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

剛剛官方同步釋出的完整技術解讀文檔來答疑解惑了。

受益於高質量演示數據集的擴展,以及對figure自研的helix神經網絡的視覺電機策略(visuo-motor policy)進行架構改進,機械人在高速工作負載下的穩定性得以長足發展。

另外通過啟動狀態感知和力感應,在不犧牲效率的情況下還全面增強了機械人的穩健性和適應性。

更多詳細技術細節如下。

數據擴展

將前後兩次視頻對比,物流任務明顯擴展至更多形態的包裹,除了標準的硬紙盒,現在還可以處理聚乙烯袋、信封和其它可摺疊、皺縮或彎曲的物品。

這讓機械人完成包裹反轉,並抓取和定位標籤的難度陡然提升。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

針對不同形態包裹,helix採取即時調整抓取策略解決,例如碰到紙盒就雙手上下一翻,碰到信封則一隻手扶住,另一隻手輕輕捏住邊緣翻轉。

值得注意的是,機械人還會輕輕拍打塑料包裝以撫平起皺的貨物條形碼,這是機械人自己從演示中學習到的自適應行為,側面凸顯出端到端學習的優勢。

儘管包裹的形狀質地都得以擴展,還有新動作的產生,但絲毫沒有影響工作效率。

實驗表明,增加訓練數據可以顯著提高吞吐量和準確性,在10到60小時中,包裹的平均處理速度約為4.05s,吞吐量提高了58%,條形碼成功率也從88.2%升至94.4%

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

總之,這些改進都表明了這是一個更加靈巧和可靠的系統,可以在廣泛的實際包裹中,更接近人類水平的速度和準確性。

架構改進

研究團隊對helix的視覺電機策略的架構進行了針對性改進,引入了新的內存和傳感模塊,能更好地幫助機械人感知環境變化。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

具體來說,可以分為視覺記憶狀態歷史力反饋三個部分:

  • 視覺記憶

helix配備了一個新的內存模塊,可以從系列視頻幀中組合特徵,再形成短期視覺記憶。

例如,在初始攝像機圖像中沒有完全顯示標籤,helix就可以調用前一時刻的圖像幀,並控制手部將包裹旋轉至標籤可見的記憶角度。

期間,機械人還可以記住它已經檢查過的包裝側面,避免重複檢查,提高成功率。

從本質上講,視覺記憶為helix提供了時間背景感,可以更有效地通過多次小型旋轉或視點調整來查找條形碼位置。

  • 狀態歷史

該策略在固定持續時間內的動作分塊(action chunk)中運行,也就是將連續動作序列分割為固定長度的小段進行規劃和執行。

首先會觀察當前狀態(手、軀幹和頭部)並輸出一小段運動軌跡,反覆重新觀察多次後,再將全部狀態合併輸入,以確保模塊間的連續性。

由於狀態歷史記錄保留了上下文,即使重新規劃或面對干擾,機械人仍能保持穩健,例如當包裹抓取失敗時,helix會以最小的延遲迅速糾正運動,顯著縮短了處理時間。

  • 力反饋

為了賦予helix觸感,機械人施加在環境和目標上的力,被反饋送至神經網絡狀態輸入中,以幫助機械人動態調整運動過程,例如當它檢測到與傳送帶接觸時,會暫停向下繼續運動。

通過一個閉合迴路,helix可以實現更精準的控制,提高運動的成功率和一致性,也更能適應不同形態重量的物流包裹。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

在啟用新策略後,條形碼定向朝下的成功率提高到94%,平均處理時間降至4.05s,同時精度保持在92%以上。

另外,figure 02除了可以完成自主分揀,其端對端模型還可以輕鬆建立人機交互

無需單獨的程序或模式開關,僅通過神經網絡的視覺調節,當站在一旁的人類伸出手,機械人就會自動認定這是交出物品的提示,並將包裹遞交給人類而不是傳送帶。

這反映了helix神經網絡的靈活性,只需少量演示,即可學習新的上下文相關行為。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

one more thing

視頻一出,figure創始人的評論區就炸開了鍋。

有網友樂見其成,讚歎figure不搞demo,直接放一小時視頻的自信。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

有網友看到機械人參與物流工作帶來的效率和成本考量。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

自然也少不了老生常談的話題:人類怎樣才能避免被機械人取代?

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

也有技術宅思考為什麼物流機械人一定要仿人類外型,三頭六臂似乎效率更高。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

當然也少不了拿放大鏡看視頻的樂子人,致力於找機械人的茬。

Figure自曝完整技術:60分鐘不間斷打工,我們的機械人如何做到? - 天天要聞

也歡迎大家一起來找茬,或者在本評論區留下你的真知灼見。

參考鏈接:

[1]https://www.figure.ai/news/scaling-helix-logistics

[2]https://www.figure.ai/news/helix

[3]https://www.figure.ai/news/helix-logistics

[4]https://x.com/adcock_brett/status/1931391783306678515

科技分類資訊推薦

英特爾酷睿 5 120F 處理器曝光:6 個 P 核 12 線程、睿頻 4.5GHz - 天天要聞

英特爾酷睿 5 120F 處理器曝光:6 個 P 核 12 線程、睿頻 4.5GHz

IT之家 6 月 14 日消息,科技媒體 WccFtech 今天(6 月 14 日)發佈博文,分享了英特爾酷睿 5 120F 處理器的規格信息,擁有 6 個 P 核和 12 線程,基礎頻率為 2.5 GHz,睿頻為 4.5GHz。IT之家援引博文介紹,酷睿 5 120F 處理器隸屬於 Bartlett Lake 系列,該系列僅採用 P 核(Performan
這次波音787為何沒有全球停飛? - 天天要聞

這次波音787為何沒有全球停飛?

不進行全球停飛,也許是其一種態度。文 | 海上客印度航空當地時間6月12日空難,着着實實是創了不少紀錄的。人員傷亡方面,不僅機上兩百餘人僅一位存活,且飛機墜落後砸中了古吉拉特邦艾哈邁達巴德機場附近一所醫學院學生宿舍,又帶走了幾十人的性命!工作人員抬走遇難者屍體不僅如此——這一發生在印度總理莫迪家鄉的空難,...
剛剛,國務院開會,優化耗材集采 - 天天要聞

剛剛,國務院開會,優化耗材集采

器械之家醫療器械媒體報道先鋒分享專業醫療器械知識關注來源:新華社、國家醫保局今日(6月13日),國家醫保局轉發新華社文章,國務院總理李強6月13日主持召開國務院常務會議,部署中國(上海)自由貿易試驗區試點措施複製推廣工作,聽取構建房地產發展新模式和推進好房子建設有關情況彙報,審議通過《關於進一步完善信用修...
光伏清洗機械人履帶:提升清潔效率的核心部件 - 天天要聞

光伏清洗機械人履帶:提升清潔效率的核心部件

光伏面板作為太陽能發電系統的核心組件,長期暴露在戶外環境中,表面極易積聚灰塵、污垢等雜質,嚴重影響發電效率。隨着自動化技術的快速發展,光伏清洗機械人已成為越來越多發電站的清潔方案。在這一過程中,光伏清洗機械人履帶作為關鍵部件,其性能直接影響
如何讓區塊鏈技術更好賦能實體經濟 - 天天要聞

如何讓區塊鏈技術更好賦能實體經濟

區塊鏈是數據共享和價值流通的重要基礎設施,是下一代價值互聯網絡的核心技術。隨着區塊鏈技術在多場景積極落地,釋放出顯著的市場價值。實踐證明,區塊鏈只有深深紮根在具體應用場景中,才能夠真正發揮出重要作用。在「十五五」期間,要更好推動區塊鏈技術賦能實體經濟,加快與場景融合發展。堅持系統性思維一方面,要用整...
通訊|中企助力尼日利亞水電樞紐重獲新生 - 天天要聞

通訊|中企助力尼日利亞水電樞紐重獲新生

新華社阿布賈6月10日電 通訊|中企助力尼日利亞水電樞紐重獲新生 新華社記者楊喆 朱悅 在尼日利亞中北部尼日爾州新布薩以東約17公里,非洲第三長河尼日爾河流經卡因吉大壩,發出轟隆隆巨響,向下游傾瀉而去。 這是2025年6月1日在尼日利亞尼日爾州拍攝的卡因吉水電站內的水電機組。新華社發(中國電建華東院公司供圖) 坐落...