Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到?

2025年06月13日16:50:20 科技 9197

鹭羽 发自 凹非寺

量子位 | 公众号 qbitai

好家伙,机器人进厂打工原视频流出,整整60分钟,完全未剪辑。

前几天figure 02晒1分钟物流分拣视频,网友们完全没看够啊。

于是figure创始人立马60分钟进厂打工vlog(未删减版)奉上。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

可灵活处理更多类型包裹,更接近人类水平的硬件运动,仔细看机器人在工作时,还会实时查看新数据来观察学习。

可以很轻松地从一堆非结构化的杂乱对象中抽出包裹,并在推走一个包裹的同时,伸手去取另外一个包裹。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

短时间内整体性能飞速提升,到底发生了什么?

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

刚刚官方同步释出的完整技术解读文档来答疑解惑了。

受益于高质量演示数据集的扩展,以及对figure自研的helix神经网络的视觉电机策略(visuo-motor policy)进行架构改进,机器人在高速工作负载下的稳定性得以长足发展。

另外通过启动状态感知和力感应,在不牺牲效率的情况下还全面增强了机器人的稳健性和适应性。

更多详细技术细节如下。

数据扩展

将前后两次视频对比,物流任务明显扩展至更多形态的包裹,除了标准的硬纸盒,现在还可以处理聚乙烯袋、信封和其它可折叠、皱缩或弯曲的物品。

这让机器人完成包裹反转,并抓取和定位标签的难度陡然提升。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

针对不同形态包裹,helix采取即时调整抓取策略解决,例如碰到纸盒就双手上下一翻,碰到信封则一只手扶住,另一只手轻轻捏住边缘翻转。

值得注意的是,机器人还会轻轻拍打塑料包装以抚平起皱的货物条形码,这是机器人自己从演示中学习到的自适应行为,侧面凸显出端到端学习的优势。

尽管包裹的形状质地都得以扩展,还有新动作的产生,但丝毫没有影响工作效率。

实验表明,增加训练数据可以显著提高吞吐量和准确性,在10到60小时中,包裹的平均处理速度约为4.05s,吞吐量提高了58%,条形码成功率也从88.2%升至94.4%

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

总之,这些改进都表明了这是一个更加灵巧和可靠的系统,可以在广泛的实际包裹中,更接近人类水平的速度和准确性。

架构改进

研究团队对helix的视觉电机策略的架构进行了针对性改进,引入了新的内存和传感模块,能更好地帮助机器人感知环境变化。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

具体来说,可以分为视觉记忆状态历史力反馈三个部分:

  • 视觉记忆

helix配备了一个新的内存模块,可以从系列视频帧中组合特征,再形成短期视觉记忆。

例如,在初始摄像机图像中没有完全显示标签,helix就可以调用前一时刻的图像帧,并控制手部将包裹旋转至标签可见的记忆角度。

期间,机器人还可以记住它已经检查过的包装侧面,避免重复检查,提高成功率。

从本质上讲,视觉记忆为helix提供了时间背景感,可以更有效地通过多次小型旋转或视点调整来查找条形码位置。

  • 状态历史

该策略在固定持续时间内的动作分块(action chunk)中运行,也就是将连续动作序列分割为固定长度的小段进行规划和执行。

首先会观察当前状态(手、躯干和头部)并输出一小段运动轨迹,反复重新观察多次后,再将全部状态合并输入,以确保模块间的连续性。

由于状态历史记录保留了上下文,即使重新规划或面对干扰,机器人仍能保持稳健,例如当包裹抓取失败时,helix会以最小的延迟迅速纠正运动,显著缩短了处理时间。

  • 力反馈

为了赋予helix触感,机器人施加在环境和目标上的力,被反馈送至神经网络状态输入中,以帮助机器人动态调整运动过程,例如当它检测到与传送带接触时,会暂停向下继续运动。

通过一个闭合回路,helix可以实现更精准的控制,提高运动的成功率和一致性,也更能适应不同形态重量的物流包裹。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

在启用新策略后,条形码定向朝下的成功率提高到94%,平均处理时间降至4.05s,同时精度保持在92%以上。

另外,figure 02除了可以完成自主分拣,其端对端模型还可以轻松建立人机交互

无需单独的程序或模式开关,仅通过神经网络的视觉调节,当站在一旁的人类伸出手,机器人就会自动认定这是交出物品的提示,并将包裹递交给人类而不是传送带。

这反映了helix神经网络的灵活性,只需少量演示,即可学习新的上下文相关行为。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

one more thing

视频一出,figure创始人的评论区就炸开了锅。

有网友乐见其成,赞叹figure不搞demo,直接放一小时视频的自信。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

有网友看到机器人参与物流工作带来的效率和成本考量。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

自然也少不了老生常谈的话题:人类怎样才能避免被机器人取代?

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

也有技术宅思考为什么物流机器人一定要仿人类外型,三头六臂似乎效率更高。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

当然也少不了拿放大镜看视频的乐子人,致力于找机器人的茬。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

也欢迎大家一起来找茬,或者在本评论区留下你的真知灼见。

参考链接:

[1]https://www.figure.ai/news/scaling-helix-logistics

[2]https://www.figure.ai/news/helix

[3]https://www.figure.ai/news/helix-logistics

[4]https://x.com/adcock_brett/status/1931391783306678515

科技分类资讯推荐

英特尔酷睿 5 120F 处理器曝光:6 个 P 核 12 线程、睿频 4.5GHz - 天天要闻

英特尔酷睿 5 120F 处理器曝光:6 个 P 核 12 线程、睿频 4.5GHz

IT之家 6 月 14 日消息,科技媒体 WccFtech 今天(6 月 14 日)发布博文,分享了英特尔酷睿 5 120F 处理器的规格信息,拥有 6 个 P 核和 12 线程,基础频率为 2.5 GHz,睿频为 4.5GHz。IT之家援引博文介绍,酷睿 5 120F 处理器隶属于 Bartlett Lake 系列,该系列仅采用 P 核(Performan
这次波音787为何没有全球停飞? - 天天要闻

这次波音787为何没有全球停飞?

不进行全球停飞,也许是其一种态度。文 | 海上客印度航空当地时间6月12日空难,着着实实是创了不少纪录的。人员伤亡方面,不仅机上两百余人仅一位存活,且飞机坠落后砸中了古吉拉特邦艾哈迈达巴德机场附近一所医学院学生宿舍,又带走了几十人的性命!工作人员抬走遇难者尸体不仅如此——这一发生在印度总理莫迪家乡的空难,...
刚刚,国务院开会,优化耗材集采 - 天天要闻

刚刚,国务院开会,优化耗材集采

器械之家医疗器械媒体报道先锋分享专业医疗器械知识关注来源:新华社、国家医保局今日(6月13日),国家医保局转发新华社文章,国务院总理李强6月13日主持召开国务院常务会议,部署中国(上海)自由贸易试验区试点措施复制推广工作,听取构建房地产发展新模式和推进好房子建设有关情况汇报,审议通过《关于进一步完善信用修...
光伏清洗机器人履带:提升清洁效率的核心部件 - 天天要闻

光伏清洗机器人履带:提升清洁效率的核心部件

光伏面板作为太阳能发电系统的核心组件,长期暴露在户外环境中,表面极易积聚灰尘、污垢等杂质,严重影响发电效率。随着自动化技术的快速发展,光伏清洗机器人已成为越来越多发电站的清洁方案。在这一过程中,光伏清洗机器人履带作为关键部件,其性能直接影响
如何让区块链技术更好赋能实体经济 - 天天要闻

如何让区块链技术更好赋能实体经济

区块链是数据共享和价值流通的重要基础设施,是下一代价值互联网络的核心技术。随着区块链技术在多场景积极落地,释放出显著的市场价值。实践证明,区块链只有深深扎根在具体应用场景中,才能够真正发挥出重要作用。在“十五五”期间,要更好推动区块链技术赋能实体经济,加快与场景融合发展。坚持系统性思维一方面,要用整...
通讯|中企助力尼日利亚水电枢纽重获新生 - 天天要闻

通讯|中企助力尼日利亚水电枢纽重获新生

新华社阿布贾6月10日电 通讯|中企助力尼日利亚水电枢纽重获新生 新华社记者杨喆 朱悦 在尼日利亚中北部尼日尔州新布萨以东约17公里,非洲第三长河尼日尔河流经卡因吉大坝,发出轰隆隆巨响,向下游倾泻而去。 这是2025年6月1日在尼日利亚尼日尔州拍摄的卡因吉水电站内的水电机组。新华社发(中国电建华东院公司供图) 坐落...