
從春節至今,一場關於人形機械人的全球大戰,在各家公司的花樣短視頻中激烈地進行中,跳舞、空翻、跑步,你方唱罷我登場,好不熱鬧。
有人說,我的理想是機械人去幹活,我去跳舞跑步,結果現在機械人過上了我的理想生活。
人形機械人的「跳舞」與「空翻」固然是先進技術不斷突破的象徵,但真正滿足「人民需求」的關鍵在於解決實際痛點。所以,當正解局看到已經有人形機械人走到流水線時,我們是興奮的;當得知一大群人形機械人已經入職搬磚時,我們是震驚的——
就在前幾天,東風柳汽宣布將於其汽車製造工廠內部署20台優必選工業人形機械人Walker S1,並計劃在上半年完成,應用於汽車整車製造。這是全球首次人形機械人批量進入汽車工廠的案例。
如果說之前跳舞空翻的機械人帶來的是獵奇,那麼,當第一批「牛馬」機械人持證上崗,我們離理想的未來,又近了多少呢?

從公眾視角看,2025年可謂是「人形機械人」元年。
從開年至今,100天不到的時間裏,我們爆髮式地見證了中西方各類機械人的技術展示,在各種工作生活場景中遊刃有餘,以至於每次看完機械人的宣傳片,我們都有一種「未來已來」的深刻觸動。
然而關掉手機回歸現實,我們的生活依然一成不變。看着那些幾萬到幾十萬的機械人售價,它們似乎只是進化成了一個很貴的「大玩具」而已。
事實上對於企業而言,人形機械人早已不是「科技玩具」,而是一種可提升生產效率的新質生產力。
在特斯拉工廠,特斯拉Optimus Gen3正在執行電池分揀、設備調試、工具操作等任務,替代人工效率提升30%,未來他們可以在車間完成如焊接、噴塗等危險或重複性工序。

特斯拉Optimus Gen3
支持自然語言指令下複雜協作的Figure AI,在寶馬工廠執行高強度物流分揀,日均工作20小時,任務中斷率低於0.3%,未來將拓展至如老人護理的家庭服務和零售貨架補貨等商業場景中;
作為奔馳合作方的 Apptronik,已經在汽車製造場景深度滲透。這些搭載32個執行器的Apollo機械人,結合奔馳自動駕駛技術遷移,實現工廠內動態路徑規劃與避障。在奔馳匈牙利工廠試點中,零部件配送效率提高40%,人力成本降低32%。
在中國,人形機械人也開始走進工廠「打工」。今年3月,數十台優必選Walker S1應用「群體智能」技術,開展了全球首例多台、多場景、多任務的協同實訓。
在極氪工廠,這些機械人在總裝車間、SPS儀錶區、質檢區及車門裝配區等多個複雜場景,成功實現了協同分揀、協同搬運和精密裝配等多任務協同作業。
目前,優必選工業人形機械人Walker S系列已經在車廠完成了第一階段的實訓。除了在極氪工廠的實訓之外,20台工業人形機械人Walker S1,將在今年上半年「轉正入職」東風柳汽。

優必選工業人形機械人Walker S1在極氪5G智慧工廠
是的,與跳舞空翻的其他機械人相比,這些在車間里「枯燥無味」的搬磚機械人顯得沒那麼「炫」,但是,「笨功夫也是好功夫」。
「人形機械人進廠」看似科幻,但卻很可能揭開第四次工業革命的序幕——人形機械人,正成為中美科技博弈的新戰場。
尤其是在全球製造業面臨人口老齡化、勞動力紅利衰退的背景下,人形機械人作為「通用人工智能的物理載體」,正成為中美科技競爭的核心戰場。
這幾年,在勞動力紅利衰退的背景下,美國製造業迴流面臨勞動力成本高、技能短缺等挑戰,人形機械人進廠可以進一步降低了人工依賴,部分抵消了勞動力成本劣勢。
例如,根據ARK(方舟投資)的研究數據,美國製造業目前僱傭了近1200萬工人,他們每年累計工作約2300億小時,獲得的總薪酬高達7850億美元,創造了價值約2.4萬億美元的產出。那麼極端情況下,只要590萬台每天工作16小時的機械人,就能夠維持現有的製造業產出水平(機械人數量僅為當前工人總數的一半)。
在這場對決中,美國在AI算法、高端芯片領域保持領先,中國則是在硬件成本、供應鏈效率上建立優勢,例如我們的製造業工資僅為美國1/4,且供應鏈集群成熟,2024年工業機械人安裝量佔全球50%。
另一方面,中國也在用更多先進性的策略實現人形機械人產業的突圍。工信部印發的《人形機械人創新發展指導意見》提到,聚焦3C、汽車等製造業重點領域,提升人形機械人工具操作與任務執行能力,打造人形機械人示範產線和工廠,在典型製造場景實現深度應用。對於應用場景的明確指示,就為中國人形機械人從「炫技」走向「生產力」打下了基礎。
可見,中美在人形機械人領域的競爭,本質是通用人工智能時代產業主導權的爭奪。這些在工業上看似枯燥的「笨功夫」,卻是影響世界未來的「好功夫」。

既然人形機械人對於未來世界如此重要,那我們是不是已經拿到了駛向未來的「船票」,甚至是「遙遙領先」了?
誠然,在這段時間我們的機械人完成了很多「世界第一」的動作,但是真實的世界總是殘酷的。只有流量,是遠遠不夠的。
就像圖靈獎獲得者楊立昆對人形機械人的「表演式展示」 持謹慎態度,他甚至批評某些機械人缺乏自主性,認為它們本質是 「電子動畫」,無法真正理解物理世界。
在楊立昆看來,「真正的智能,需建立在對世界的理解之上。」
所以,當我們的人形機械人能夠「跳舞空翻」,只是證明了我們在運動控制技術上獲得了突破,但是人形機械人更重要的,是具身智能(Embodied AI)的發展。
例如,「將工具放入工具箱第三層」 這個連小孩都能聽懂的指令,但對於大多數機械人而言,卻是一個「世紀難題」。
因為人形機械人在沒有足夠智能水平的加持下,無法真正理解物理世界,現有大語言模型(LLM)僅能處理文本,缺乏因果推理和物理常識。
在浙江大學機械人實驗室的負責人熊蓉教授看來,人形機械人的核心價值在於適配人類環境、工具及交互方式。作為行為智能的載體,具身智能需通過「感知-推理-交互」閉環實現自主作業能力。
或許,相比起「騰空」,中國的機械人更需要「落地」。
第一個「落地」,是讓人形機械人從實驗室走出來,走到真實的工作生活中的應用去;
第二個「落地」,是我們要更加關注能讓人形機械人「落地」的具身智能;
第三個「落地」,是讓人形機械人企業「落地」,不要建立空中樓閣,更是靠腳踏實地攻克關鍵技術。
縱觀全球,已經有一些人形機械人企業在具身智能投入了更多的「笨功夫」。
在2024年5月的演示中,由特斯拉生產的Optimus可蒙眼在辦公室地毯、瓷磚等混合地面行走,僅依靠傳感器反饋維持平衡,還能使機械人能理解 「將工具放入工具箱第三層」 等複雜指令。
今年2月,Figure AI宣布推出自主研發的通用具身智能模型Helix,它是首款能對整個人形機械人上半身進行高頻率、連續控制的視覺-語言-動作(VLA)模型,可使兩台機械人協作解決共享的長期操作任務。
作為中國人形機械人的代表,優必選創新提出了人形機械人群腦網絡(BrainNet)軟件架構,並設計人形智能網聯中樞Internet of Humanoids (IoH),為群體智能的軟硬件實現提供了可借鑒的路徑。

優必選工業人形機械人Walker S1在極氪5G智慧工廠
在複雜產線級任務的高維決策需求驅動下,優必選針對性研發了全球首個人形機械人多模態推理大模型,作為超級大腦的核心引擎,推動BrainNet架構實現持續自我進化,進而迸發群體智能。
本質上,人形機械人的進廠落地,標誌着它們向「通用勞動力」發展的範式革命,有望推動人形機械人從 「替代工具」 向 「協作夥伴」 進化,開啟人機共融的智能製造新時代。
即便如此,現在的人形機械人離我們的想像還是差得太遠了。儘管人形機械人 「具身智能技術」發展潛力巨大,但它仍處於從實驗室探索向產業化突破的關鍵階段,儘管在工業場景的落地應用將驅動該技術的落地,但在其他場景依然任重道遠。
所以,當會跳舞空翻的機械人被流量裹挾時,人形機械人企業更要懂得「落地」的珍貴。人形機械人需要關注度,更需要專註度。以比亞迪,華為為代表的中國企業向世界證明了,腳踏實地的埋頭做事,這種以技術為主導的企業,才是最紅的「流量明星」。
浪花洶湧,看不見的暗流才是推動前進的力量。
流水線搬磚,無人問津,直播間舞動,流量過億。人形機械人世界的「鄙視鏈」,似乎與普通人的世界並無二異。其實,不管是舞台炫技,還是車間打工,人形機械人技術沒有高低優劣,更不存在道德評判,但哪一種人形機械人的未來是理想的未來,這才是我們當下值得深思的。
在我們看來,未來人形機械人肯定不僅僅需要跳舞空翻,更需要在方方面面為我們帶來幫助。我們圍觀「表演式機械人」的時候,更應該關注到那些從實驗室走向現實應用場景的人形機械人。
因為它們走出的一小步,卻是我們邁向未來世界的一大步。