中國團隊彎道超車！3條樣本教會機器人操作，微軟、MIT黯然失色

2025年10月17日21:12:03 科技 1092

在機器人研究領域，長期存在一個令人頭疼的難題：訓練數據太少。

與ChatGPT這類“坐在電腦後”的模型不同，機器人需要在真實環境中動手操作——推開一扇門、擰緊一個螺絲，甚至整理雜亂的桌面。

每一次嘗試都可能伴隨着磕碰、延遲或失敗，導致數據採集成本高、效率低。

更麻煩的是，許多任務依賴特定場景，換個光線、換個工具，機器人可能就直接“懵了”。

正因如此，目前公開的機器人操作數據集規模普遍有限，能達到百萬級別交互的屈指可數。

不過，這一困局最近被國內一家創新團隊打破了。

中科第五紀發布了新一代具身操作基礎模型 FAM-1，它只需要 3-5 條示範數據，就能讓機器人學會一項新任務，成功率高達 97%。

舉個例子，過去要讓機器人學會“把釘子敲進木板”，可能需要演示幾百次；

而現在，只需在它面前敲 3 次，它就能模仿得像模像樣，甚至在光線變化、背景干擾下依然穩定發揮。

這一成果在CVPR 2025具身操作競賽中擊敗了來自微軟、MIT等國際團隊，拿下冠軍。

有意思的是，FAM-1的核心技術並非“暴力堆數據”，而是巧妙地從現有視覺語言大模型中“提煉”知識。

團隊提出了一種名為 BridgeVLA 的架構，把傳統上用於理解圖像和文本的模型，與機器人操控任務“嫁接”在一起。

簡單來說，它讓機器人不僅“看得懂”指令（比如“把紅色積木放進盒子”），還能在三維空間中精準規划動作軌跡——就像人腦能一邊聽指令，一邊協調手眼完成動作。

FAM-1如何實現少樣本蛻變？

為什麼傳統機器人模型需要海量數據？問題出在“維度壓縮”。

大多數模型會把三維空間信息（比如深度、距離）壓縮成一維數據，導致機器人對環境的理解變得模糊。

就像一個近視的人沒戴眼鏡，只能靠猜去拿水杯，容易打翻。FAM-1 的解決思路很直接：全程保持三維。它通過熱力圖建模空間關係，讓機器人對每個動作的位置、力度、方向都“心裡有數”。

另一個關鍵創新是知識遷移。團隊利用網絡上的海量圖像、視頻，預先訓練模型理解物理世界的常識——比如“玻璃杯易碎”“抽屜需要向外拉”。

這些知識看似與操作無關，實則讓機器人具備了“舉一反三”的能力。

例如，即使它從未見過某款門把手，也能根據“旋轉開啟”的常識成功開門。這種設計顯著降低了數據依賴，甚至能從人類操作視頻中無監督學習策略（相關論文已被 ICCV 2025 接收）。

實驗數據印證了模型的強大泛化能力：在 RLBench 測試中，FAM-1 在“插入木樁”“開關抽屜”等任務上的平均成功率比此前最優模型高出 30% 以上；

在真實機械臂測試中，面對動態光照、遮擋物干擾等複雜場景，仍保持 97% 的穩定表現。

有業內專家評價：“這標誌着具身智能從‘實驗室玩具’邁向‘工業級工具’的關鍵一步。”

當然，技術突破只是開始。

中科第五紀的下一步很明確：把模型落地到工業流水線、家庭服務等場景。

可以想象，未來工廠里的機械臂不再需要為每個新品重新編程，看幾遍演示就能上崗；家用機器人也不會因為沙發換位置而“死機”。

不得不說，當機器人學會“偷師學藝”，人類離真正的智能協作就更近了一步。

科技

漲價壓不住、補貼夠不着，這個五一6000元以上機型難住手機經銷商

圖源：藍鯨科技記者拍攝藍鯨新聞5月3日訊(記者翟智超)按照往年慣例，五一勞動節是手機廠商集中促銷、衝量的關鍵節點，但今年這場例行的“節前大促”卻未能點燃消費熱情。 5月2日下....

05月03日 7401

AI能否超越人類？中南大學院士，走進武鋼三中，開講“硬核”AI課

4月29日，在武漢市武鋼三中的報告廳里，一場關於人工智能的科普報告正在進行。台上，中國工程院院士、中南大學教授桂衛華以“大模型與工業應用”為題，為高一學生揭開AI大模型的神秘面紗。桂衛華，中國工程院院士，中南大學教授、博士生導師。

05月03日 1895

引領科技豪華MPV新風尚第二代騰勢D9西安車展亮相

兼具宜商氣度與家用溫情的科技豪華旗艦MPV，第二代騰勢D9迎來西安地區正式亮相。新車依託全球新能源MPV冠軍底蘊，以第二代刀片電池、雙閥雲輦-C、天神之眼5.0智駕等核心技術全面升級，兼顧商務體面與家庭舒適，為西北高端用戶帶來一站式全能出行解決方案。

05月03日 2042

採購禁入！科華數據材料造假被拒門外

本報（chinatimes.net.cn）記者胡雅文北京報道這家趕上AI算力風口的公司，因投標材料造假，被相關採購方列入禁入名單兩年，其此前提出的複議申請也被正式駁回。相關採購平台近日發布公告，明確駁回科華數據股份有限公司（下稱“科華數據”，002335.SZ）此前提交的複議申請。早在一年前，科華數據已被認定在“信息通信樞紐...

05月03日 9437