Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到?

2025年06月13日16:50:20 科技 9197

鹭羽 发自 凹非寺

量子位 | 公众号 qbitai

好家伙,机器人进厂打工原视频流出,整整60分钟,完全未剪辑。

前几天figure 02晒1分钟物流分拣视频,网友们完全没看够啊。

于是figure创始人立马60分钟进厂打工vlog(未删减版)奉上。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

可灵活处理更多类型包裹,更接近人类水平的硬件运动,仔细看机器人在工作时,还会实时查看新数据来观察学习。

可以很轻松地从一堆非结构化的杂乱对象中抽出包裹,并在推走一个包裹的同时,伸手去取另外一个包裹。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

短时间内整体性能飞速提升,到底发生了什么?

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

刚刚官方同步释出的完整技术解读文档来答疑解惑了。

受益于高质量演示数据集的扩展,以及对figure自研的helix神经网络的视觉电机策略(visuo-motor policy)进行架构改进,机器人在高速工作负载下的稳定性得以长足发展。

另外通过启动状态感知和力感应,在不牺牲效率的情况下还全面增强了机器人的稳健性和适应性。

更多详细技术细节如下。

数据扩展

将前后两次视频对比,物流任务明显扩展至更多形态的包裹,除了标准的硬纸盒,现在还可以处理聚乙烯袋、信封和其它可折叠、皱缩或弯曲的物品。

这让机器人完成包裹反转,并抓取和定位标签的难度陡然提升。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

针对不同形态包裹,helix采取即时调整抓取策略解决,例如碰到纸盒就双手上下一翻,碰到信封则一只手扶住,另一只手轻轻捏住边缘翻转。

值得注意的是,机器人还会轻轻拍打塑料包装以抚平起皱的货物条形码,这是机器人自己从演示中学习到的自适应行为,侧面凸显出端到端学习的优势。

尽管包裹的形状质地都得以扩展,还有新动作的产生,但丝毫没有影响工作效率。

实验表明,增加训练数据可以显著提高吞吐量和准确性,在10到60小时中,包裹的平均处理速度约为4.05s,吞吐量提高了58%,条形码成功率也从88.2%升至94.4%

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

总之,这些改进都表明了这是一个更加灵巧和可靠的系统,可以在广泛的实际包裹中,更接近人类水平的速度和准确性。

架构改进

研究团队对helix的视觉电机策略的架构进行了针对性改进,引入了新的内存和传感模块,能更好地帮助机器人感知环境变化。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

具体来说,可以分为视觉记忆状态历史力反馈三个部分:

  • 视觉记忆

helix配备了一个新的内存模块,可以从系列视频帧中组合特征,再形成短期视觉记忆。

例如,在初始摄像机图像中没有完全显示标签,helix就可以调用前一时刻的图像帧,并控制手部将包裹旋转至标签可见的记忆角度。

期间,机器人还可以记住它已经检查过的包装侧面,避免重复检查,提高成功率。

从本质上讲,视觉记忆为helix提供了时间背景感,可以更有效地通过多次小型旋转或视点调整来查找条形码位置。

  • 状态历史

该策略在固定持续时间内的动作分块(action chunk)中运行,也就是将连续动作序列分割为固定长度的小段进行规划和执行。

首先会观察当前状态(手、躯干和头部)并输出一小段运动轨迹,反复重新观察多次后,再将全部状态合并输入,以确保模块间的连续性。

由于状态历史记录保留了上下文,即使重新规划或面对干扰,机器人仍能保持稳健,例如当包裹抓取失败时,helix会以最小的延迟迅速纠正运动,显著缩短了处理时间。

  • 力反馈

为了赋予helix触感,机器人施加在环境和目标上的力,被反馈送至神经网络状态输入中,以帮助机器人动态调整运动过程,例如当它检测到与传送带接触时,会暂停向下继续运动。

通过一个闭合回路,helix可以实现更精准的控制,提高运动的成功率和一致性,也更能适应不同形态重量的物流包裹。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

在启用新策略后,条形码定向朝下的成功率提高到94%,平均处理时间降至4.05s,同时精度保持在92%以上。

另外,figure 02除了可以完成自主分拣,其端对端模型还可以轻松建立人机交互

无需单独的程序或模式开关,仅通过神经网络的视觉调节,当站在一旁的人类伸出手,机器人就会自动认定这是交出物品的提示,并将包裹递交给人类而不是传送带。

这反映了helix神经网络的灵活性,只需少量演示,即可学习新的上下文相关行为。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

one more thing

视频一出,figure创始人的评论区就炸开了锅。

有网友乐见其成,赞叹figure不搞demo,直接放一小时视频的自信。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

有网友看到机器人参与物流工作带来的效率和成本考量。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

自然也少不了老生常谈的话题:人类怎样才能避免被机器人取代?

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

也有技术宅思考为什么物流机器人一定要仿人类外型,三头六臂似乎效率更高。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

当然也少不了拿放大镜看视频的乐子人,致力于找机器人的茬。

Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到? - 天天要闻

也欢迎大家一起来找茬,或者在本评论区留下你的真知灼见。

参考链接:

[1]https://www.figure.ai/news/scaling-helix-logistics

[2]https://www.figure.ai/news/helix

[3]https://www.figure.ai/news/helix-logistics

[4]https://x.com/adcock_brett/status/1931391783306678515

科技分类资讯推荐

90年代的前瞻之作:日产R'nessa技术创新回顾 - 天天要闻

90年代的前瞻之作:日产R'nessa技术创新回顾

日产R'nessa是日产汽车公司在1997年推出的一款旅行车型,虽然在市场上的存在时间相对较短,但其独特的设计理念和技术创新却为汽车史留下了值得铭记的一页。作为日产在20世纪90年代探索多元化车型布局的重要产品,R'nessa承载着日产对家用旅行车市场的独特理
应对AI时代挑战 微软、OpenAI等牵头建立教师培训学院 - 天天要闻

应对AI时代挑战 微软、OpenAI等牵头建立教师培训学院

财联社7月9日讯(编辑 赵昊)当地时间周二(7月8日),美国教师联盟(AFT)在官网宣布,将携手美国教师联合会、微软、OpenAI和Anthropic合作成立一个全新的培训中心。该培训中心名为“National Academy for AI Teaching”(国家人工智能教学学院),旨在帮助美国各地的教育工作者在课堂上运用人工智能(AI)工具。新闻稿写..
小心拼多多广告自动骗扣你的钱 - 天天要闻

小心拼多多广告自动骗扣你的钱

笔者经常在网络上购物,对于一些购物广告也时常点击看一下,遇到合适的商品也会下单。过去,笔者在手机上设置了识脸支付和指纹支付,后来发现,识脸支付和指纹指纹经常发生误支付的情况,便取消了这两种支付手段,很多购网购者也都因为这个原因取消了这两种支
吃土半年就为换套智能锁,结果还被坑了:智能锁牢记“5不选” - 天天要闻

吃土半年就为换套智能锁,结果还被坑了:智能锁牢记“5不选”

攒了大半年钱换智能锁,结果用起来各种糟心,这事谁遇上都得憋屈。门锁是家的第一道防线,选错了可不只是花钱打水漂,搞不好连安全感都搭进去。市面上那些花里胡哨的功能,听着高级用着鸡肋,白白掏空钱包还添堵。先说指纹识别,光学款看着方便实际漏洞百出,
被误解的Linux:我们错过的,远不止一个系统 - 天天要闻

被误解的Linux:我们错过的,远不止一个系统

提到电脑系统,你的第一反应是不是Windows?顶多,再加一个苹果的macOS。  但如果我说出“Linux”这个词,你脑海里浮现的,恐怕就是一串串滚动的绿色代码,和一个戴着眼镜、在昏暗房间里埋头敲键盘的“大神”形象吧?
拟入主688585,智元机器人要来A股了!公司联合创始人曾是华为“天才少年” - 天天要闻

拟入主688585,智元机器人要来A股了!公司联合创始人曾是华为“天才少年”

7月8日,上纬新材(688585.SH,股价7.78元,市值31.38亿元)发布公告称,智元机器人拟至少收购其63.62%股份。待本次股权交易完成后,上纬新材控股股东将变更为智元机器人及其管理团队共同持股的主体,实际控制人将变更为邓泰华,核心团队包括稚晖君等。 本次交易如成功落地,有望成为国九条和并购六条实施以来,新质生产力...
天融信WAAP助力应用安全升级,护航大模型应用落地 - 天天要闻

天融信WAAP助力应用安全升级,护航大模型应用落地

在云原生架构、微服务技术普及及移动应用深度渗透的当下,Web业务部署与管理模式正被系统性重塑。应用交互流量增长、API端点激增、BOT攻击上升,大模型还颠覆了Web攻防规则,Web暴露面急剧扩张,应用层安全风险持续升级。天融信WAAP作为新一代应用安全解决方案,以WAF技术为核心,融合API安全、BOT攻击管理、抗DDoS防护等技...