來源:IT時報
IT時報記者 孫妍
“我在停車場當過交通疏導員,在汽車門店當過導購,在餐廳當過下單上菜的服務員,在理髮店幫顧客吹過頭髮……”在商場,人形機器人小麥不斷解鎖着自己的多重角色。
3月26日晚,一場頗具硅谷風的發布會以直播的形式召開,在圓桌論壇激烈討論具身智能行業話題的同時,魔法原子密集推出人形機器人小麥、四足機器人、首個端到端“原子萬象大模型”,以及打造1000個人形機器人落地場景,並量產400台人形機器人進入工業、商業場景等。信息含量之大,讓人聯想到OpenAI的那場連續12天的發布會“大戲”。
小麥的成長曆程:工人、主持人等1000種角色
開場,身高174cm,長着自研靈巧手,搭載大語言模型“大腦”的人形機器人小麥閃亮登場,在它的“生活空間”里,回顧了自己過去一年的成長曆程。
從最早的經典控制路線,到強化學習、模仿學習技術路線,小麥運動能力的成長越來越快,走路速度從0.3m/s逐漸提升,目前持續跑步速度可以達到2m/s,走路和跑步的狀態越來越像人,能在奔跑狀態下適應馬路、跑道、草地、山坡等多種環境。今年4月,小麥將參加機器人馬拉松比賽,到時看看它是不是能跑得快、跑得穩、跑得久。
2024年11月,小麥就進追覓科技工廠當產線“工人”了,在零部件上下料、物料搬運、產品檢測、點膠等崗位實訓。從最初的視覺識別、位姿估計和軌跡規劃的經典技術路線,進化到快慢雙系統的技術路線,小麥已經成長為工廠中的“熟練工”。經過三個月的訓練,小麥在高速數字馬達上下料工序中的成功率和效率實現了多倍提升。
2025年3月,小麥化身江蘇廣電總台特邀記者“蘇小麥”,赴京參與全國兩會報道,通過完成新聞播報、代表對談、市民街訪等多項工作任務,為兩會報道注入了科技感和新鮮活力。
前不久,小麥還受邀擔任一場行業發布會主持人,參與活動開場、嘉賓對談等主持環節,以多模態交互能力掌控全場節奏。在AWE2025展台上,小麥成為展會的頂流明星。
從小麥的成長曆程可見,人形機器人的落地場景有千百種可能。於是在發布會上,魔法原子宣布將啟動“千景共創計劃”,拓展1000個合作夥伴,打造1000個人形機器人落地應用場景。
小麥的職業規劃:400個小麥正在進入工廠、商場
“我將像手機、汽車一樣陪伴在大家身邊,帶來全新的生活方式。”談起未來職業規劃,小麥不滿足於做工廠打工人,商業、家庭場景都將成為小麥落地應用方向。
小麥正在開展量產,今年預計有400台人形機器人進入工業和商業場景。
在商場停車場,小麥作為交通疏導員,可以實時感知商場停車場信息,有序指引車流、指揮停車,並引導顧客乘坐電梯。作為汽車導購的小麥機器人,則憑藉VLM視覺語言大模型能力,識別分析用戶特徵,預測用戶偏好,並推薦相關車型。在理髮店,小麥智能識別顧客發質後,可以主動調節吹風機工作模式,提供更具針對性的服務項目。餐廳服務員小麥,則通過大語言模型與用戶交流,根據顧客喜好推薦菜品,高效完成下單上菜,因為小麥可以實時感知環境變化,避免與擁擠的桌椅、設備、顧客發生碰撞。
小麥頭部手部齊全、外觀相對完整、身材與人類相近,全身具備42個自由度,能高度模仿人類的動作與姿態,通過智能語音、智能化面部表情、肢體動作與人類自然流暢地進行多模態交互。而且,小麥機身採用高輕度材料,經過輕量化處理和續航優化,小麥已經能長時間提供服務,在工業、商業等場景填補人力缺口。
在2024年12月舉行的中國電信數字科技生態大會上,魔法原子與中國電信達成合作,成為天翼數字生活公司的合作夥伴。在家庭場景中,魔法原子正與中國電信開發家庭服務解決方案,探索居家養老、日常協助等應用方向。
“5年之後人形機器人將進入普通人的家庭。”魔法原子總裁吳長征在發布會上提到。
四足機器人化身導盲犬
技術的終極使命是向善。
在發布會結尾部分的彩蛋環節,魔法原子全新項目“光引001”正式曝光,其四足機器人化身導盲犬。
在戶外環境中,四足機器人可靈活自適應平地、草地等多類地形。魔法原子四足機器人能夠實時感知複雜環境,在遇到障礙物、通過路口等複雜場景中,引導視障人士進行避讓,並通過語音進行提醒。
在貨櫃前,四足機器人可以引導視障人士挑選飲料,探測到附近有評分較高的甜品店,四足機器人還能基於智慧互聯功能,幫助她下單一份草莓慕斯,並且進行掃碼支付。
“系統顯示車輛2分鐘到達。”在路邊,視障人士很難揚招出租車,他們出行多依賴網約車。四足機器人也可以幫忙下單轎車,還會將車輛預計到達時間準確告訴視障人士,讓他們在路邊安心候車。
四足機器人不再只會表演跳舞、空翻等能力,不再只是冰冷的代碼,而是溫暖的力量,在家庭陪伴、視障人士出行、商業導覽等場景中提供情緒價值和便捷方案。
原子萬象大模型 百萬級真實數據
大模型是機器人的“大腦”。原子萬象是魔法原子的首個具身智能大模型,融合了視覺語言大模型與動作專家系統,構建了快慢“雙模”協同架構。
基於動作專家模型的“快系統”能夠響應環境變化,保障機器人各個部位快速適應環境;基於多模態大模型的“慢系統”負責理解複雜環境,並規劃長期任務。基於快慢雙模協同架構,在端到端框架中,將多模態感知、自主導航、操作抓取與運動控制等功能融合到一起,並與場景深度綁定,讓人形機器人在各種垂直場景中實現自主規劃和自主作業。
以商業服務場景為例,魔法原子利用商業垂直大模型,賦能人形機器人小麥結合商業產品知識庫、衣着信息等消費者顯性特徵數據進行分析,通過語音、動作等行為主動問候、招攬顧客,推薦合適的產品給顧客,完成商業場景的應用閉環。
大模型也是機器人能力進化的智能引擎。用吳長征的話來說:“搭載大模型的機器人,智能化能力存在百倍、千倍、萬倍增長機會。”為了讓機器人能夠自主進化,賦予它類人行為範式,原子萬象大模型藉助實時理解場景能力,生成實時運動指令。
大模型之所以能持續優化,要歸功於數百萬條高價值訓練樣本。人形機器人需要大規模、群體性工序場景做數據採集、訓練學習與能力驗證,於是魔法原子與追覓科技達成戰略合作,通過持續採集生產環境中的真實數據,讓人形機器人從“能理解”進化到“能行動”。