智元機械人發佈並開源首個機械人動作序列驅動的世界模型

2025年05月26日15:20:13 科技 8722
智元機械人發佈並開源首個機械人動作序列驅動的世界模型 - 天天要聞
作者 | 褚杏娟

近日,智元機械人重磅發佈具身智能領域雙重里程碑式突破:全球首個基於機械人動作序列驅動的具身世界模型 evac (enerverse-ac),以及具身世界模型評測基準 ewmbench。這兩大創新成果現已全面開源,旨在構建「低成本模擬 - 標準化評測 - 高效迭代」的全新開發範式,持續賦能全球具身智能研究,加速技術落地與產業發展。

evac arxiv:https://arxiv.org/abs/2505.09723

evac 開源代碼:https://github.com/agibottech/enerverse-ac

ewmbench arxiv: https://arxiv.org/abs/2505.09694

ewmbench 開源代碼:https://github.com/agibottech/ewmbench

當前具身智能演進面臨兩大關鍵制約:在測試階段,真機驗證代價大、風險高,仿真系統又受制於虛實偏差;在數據層面,海量真機數據尚未構建基於軌跡擴增的高效利用機制,限制了多樣性生成與泛化訓練。為打破困局,智元機械人在去年發佈的世界模型架構 enerverse 基礎上推出創新成果:基於動作序列驅動的世界模型 evac 與具身世界模型評測榜單 ewmbench,構建從訓練到評測全鏈路技術閉環,重新定義具身世界模型研發範式。

全球首個機械人動作序列驅動的世界模型

evac 是一個能夠動態復現機械人與環境複雜交互的世界模型,標誌着從傳統仿真到生成式模擬的躍遷。

智元機械人發佈並開源首個機械人動作序列驅動的世界模型 - 天天要聞
核心能力:從 「物理執行」 到「像素空間」的精準映射

evac 基於前序工作 enerverse 架構持續演進,創新型引入多級動作條件注入機制,實現 「物理動作 - 視覺動態」 的端到端生成,其核心能力體現在以下幾個方面:

智元機械人發佈並開源首個機械人動作序列驅動的世界模型 - 天天要聞
  • 機械人動作與像素的高精度對齊:將機械臂 6d 位姿(x,y,z,roll,pitch,yaw)與末端執行器行程投影為 action map,確保物理動作與圖像幀的像素級對齊,精準建模 「抓取」、「放置」、「碰撞」、「推拉」、「快速拋擲」、「緩慢搖晃」 等複雜動力學行為;
  • 動態多視圖建模:引入 ray map 編碼相機運動軌跡,支持頭部 、腕部等多視角協同生成一致且連貫的視覺場景,賦予機械人更全面的環境生成能力。;
  • 卓越的長時序一致性:採用 chunk-wise 自回歸擴散架構與稀疏記憶機制(sparse memory),evac 能夠實現單視圖穩定生成長達 30 個連續片段、多視圖下亦可維持 10 個連續片段的無漂移穩定輸出,保證了模擬過程在時間軸上的連貫性與真實性;
  • 數據高效利用:融合 agibot-world 數據集 + 失敗軌跡(如抓取滑脫、路徑碰撞)提升生成質量,該策略能有效抑制幻覺現象,使模型能更合理、更全面地建模機械人與環境的交互動態。
生成式仿真評估 + 數據引擎雙輪驅動
智元機械人發佈並開源首個機械人動作序列驅動的世界模型 - 天天要聞
  • 生成式仿真評測

針對真機評測成本高、風險大、難以復現等痛點,evac 開創性地提出了生成式模擬評測方案,它能與待評測的策略模型進行交替推理,構建起一套完整的交互式評測管線。實驗顯示,在多個任務中,evac 所生成的評測結果與真機評測的成功率具有高度一致性,甚至能夠可靠地識別出性能更優的模型權重,大幅提升了策略模型的篩選效率。

智元機械人發佈並開源首個機械人動作序列驅動的世界模型 - 天天要聞
  • 數據增廣引擎

evac 能夠基於極少量的專家軌跡數據,通過動作插值與高保真畫面生成技術進行大規模數據增廣。應用結果表明,採用 evac 數據增廣數據訓練的策略模型,其任務成功率提升高達 29%,目標跟隨性得到顯著改善,驗證了這一方案在具身智能研究中的實用性與高性價比。

智元機械人發佈並開源首個機械人動作序列驅動的世界模型 - 天天要聞
打造具身世界模型的 「質檢尺」

為了科學、系統地衡量具身世界模型的性能表現,智元機械人推出了全球首個具身世界模型評測基準——ewmbench,旨在填補行業空白,構建統一、可信的評測標準。

智元機械人發佈並開源首個機械人動作序列驅動的世界模型 - 天天要聞
三維度評估體系:場景 × 動作 × 語義的立體考核

針對機械人操作場景的複雜性與特殊性,ewmbench 構建了立體化的評估體系,從場景一致性、動作合理性 與 語義對齊與多樣性 三大核心指標進行分析:

  • 場景一致性 scene consistency,評估生成場景中背景 / 物體 / 視角等穩固度與真實性,採用微調過的 dinov2 特徵進行量化。
  • 動作合理性 motion correctness,利用 hsd (symmetric hausdorff distance), ndtw (normalized dynamic time warping) 和 dynamics score 三重互補指標協同精確評估生成動作的合理性與動力學真實度。
  • 語義對齊與多樣性 semantic alignment & diversity,結合 mllm(多模態大模型)和 clip 從全局指令對齊度、關鍵步驟語義準確性、邏輯合理性等多個層次對生成視頻進行語義理解評估。
智元機械人發佈並開源首個機械人動作序列驅動的世界模型 - 天天要聞
權威數據支撐與便捷開源工具
  • 基準數據集:ewmbench 基於行業領先的開源百萬真機數據集 agibot world 構建,涵蓋了家居、工業、醫療三大場景的 10 類典型機械人操作任務和剛體 / 柔體 / 流體 / 關節物體等多種交互對象,其中包含超過 300 個精心設計的測試樣本及 30% 挑戰性場景(低光照 / 部分遮擋),全面驗證模型在複雜環境下的魯棒性。
  • 開源評測工具:智元機械人同步開源了全流程評測工具,支持一鍵生成標準化對比報告,大幅降低評估門檻,方便研究者快速開展模型比較與性能分析,加速實驗驗證與成果復現。
卓越評測性能:更貼近人類主觀感知
智元機械人發佈並開源首個機械人動作序列驅動的世界模型 - 天天要聞

相較於當前主流視頻生成評測基準 vbench,ewmbench 在評測結果與人類主觀判斷的一致性方面表現更優,能夠更真實、細緻地反映具身世界模型在交互理解、動作還原與視覺一致性等核心維度的實際能力。

enerverse 作為強大的世界模型基礎架構,為 evac 提供可靠的基礎框架與預訓練能力,而 evac 生成的多樣化高質量數據又能反哺 enerverse 模型的持續優化,二者形成 「訓練 - 驗證」 技術閉環,不斷推動模型性能突破。通過 ewmbench 提供的精細化、多維度量化分析,研發團隊可以精準定位 evac 在處理如 「多物體交互」「動態環境避障」 等複雜場景的潛在不足,從而進行更具針對性的優化。

據悉,evac 與 ewmbench 組合方案,已正式入選 agibot world challenge @ iros 2025 – world model 賽道的官方基線系統與評測標準。

活動推薦

6 月 27~28 日的 aicon 北京站將繼續聚焦 ai 技術的前沿突破與產業落地,圍繞 ai agent 構建、多模態應用、大模型推理性能優化、數據智能實踐、ai 產品創新等熱門議題,深入探討技術與應用融合的最新趨勢。歡迎持續關注,和我們一起探索 ai 應用的無限可能!

科技分類資訊推薦

華為天生會畫數字藝術展亮相文博會:科技賦能藝術創作 - 天天要聞

華為天生會畫數字藝術展亮相文博會:科技賦能藝術創作

【ZOL中關村在線原創新聞】5月22日,第二十一屆中國(深圳)國際文化產業博覽交易會在深圳盛大啟幕。作為中國文化產業領域的年度盛會,本屆文博會吸引了眾多政府機構、文化團體和知名企業參展,集中展示了文化產業的最新成果與發展趨勢。其中,華為天生會畫數字藝術展人潮湧動,成為眾多觀眾的熱門打卡地。展覽以「共繪自然...
榮耀400系列影像實力再升級 同檔位難尋敵手 - 天天要聞

榮耀400系列影像實力再升級 同檔位難尋敵手

【ZOL中關村在線原創新聞】榮耀400系列手機正式登場,其在影像領域的卓越表現令人矚目,影像體驗冠絕同檔,為消費者帶來了全新的拍攝體驗。在硬件配置與算法優化上,榮耀400全系搭載2億超清寫真人像主攝,並融合AI人像意圖識別引擎。這一強大組合讓榮耀400系列實現了同檔最清晰的成像體驗以及更強的動態拍攝表現,無論是拍...
榮耀400系列AI影像革新:解鎖創作自由,重塑日常AI體驗 - 天天要聞

榮耀400系列AI影像革新:解鎖創作自由,重塑日常AI體驗

【ZOL中關村在線原創新聞】榮耀400系列手機正式發佈,其AI影像創作能力迎來重大進化,多項創新功能國內首發,為影像創作領域注入全新活力,同時將AI體驗深度融入日常生活,引領智能設備使用新風尚。在影像創作方面,榮耀400系列展現出了強大的技術實力。行業國內首發的AI圖生視頻功能,打破了圖片與視頻之間的壁壘,用戶只...
榮耀400系列:超強AI賦能,性能續航雙冠絕同檔 - 天天要聞

榮耀400系列:超強AI賦能,性能續航雙冠絕同檔

【ZOL中關村在線原創新聞】榮耀400系列攜超強AI能力震撼登場,在性能與續航方面實現全面升級,成為同檔位手機中的佼佼者。在性能表現上,榮耀400全系藉助超強AI能力,性能迎來質的飛躍。其中,榮耀400 Pro搭載滿血版第三代驍龍8旗艦芯片,CPU、GPU以及AI各項性能均有顯著提升。結合榮耀深厚的底層調教技術,為用戶打造出更...
榮耀400 Pro上手評測:2億超清寫真人像重新定義移動影像標杆 - 天天要聞

榮耀400 Pro上手評測:2億超清寫真人像重新定義移動影像標杆

【ZOL中關村在線原創評測】不知道大家有沒有一種感覺,雖然現在手機的影像配置越來越強大,但是普通用戶依舊很難拍出讓自己滿意的照片,特別是在轉瞬即逝的人生時刻,普通用戶很難快速完成構圖、光影、影調等方面的調整,快速拍下自己的人生照片。在此前的幾代機型中,榮耀數字系列通過推出「單反級人像拍攝」和「全場景雅...
榮耀400系列:屏幕、護眼、功能全面升級 - 天天要聞

榮耀400系列:屏幕、護眼、功能全面升級

【ZOL中關村在線原創新聞】榮耀400系列手機正式發佈,憑藉在屏幕顯示、護眼技術、功能拓展以及通信能力等多方面的卓越表現,尤其是屏幕體驗冠絕同檔,為消費者帶來全方位的極致體驗。屏幕方面,榮耀400系列搭載了一塊擁有5000nits超級亮度的通透清晰好屏。如此高的亮度,即便在陽光直射的戶外環境下,用戶也能自由、清晰地...
小米盧偉冰:一個能打的對手都沒有 SU7產品力表現強勁 - 天天要聞

小米盧偉冰:一個能打的對手都沒有 SU7產品力表現強勁

站長之家(ChinaZ.com)5月28日 消息:今日,小米集團舉行了2025年一季度業績電話會,小米集團總裁盧偉冰等高層管理人員出席了此次會議。會上,針對小米汽車相關話題,盧偉冰發表了一系列看法。在回答媒體關於小米YU7標配激光雷達是否會對定價策略或盈利能力產生影響的問題時,盧偉冰指出,小米YU7產品力表現強勁。不過,目...
小米王騰:REDMI K80至尊版將是行業3K檔最豪華的性能之王 - 天天要聞

小米王騰:REDMI K80至尊版將是行業3K檔最豪華的性能之王

站長之家(ChinaZ.com)5月28日 消息:今日,小米中國區市場部總經理、REDMI品牌總經理王騰通過社交平台發文,提前為REDMI新機K80至尊版「預熱」。他透露,REDMI K80至尊版將成為行業3K檔最豪華的性能之王,不僅性能在安卓陣營中依舊佔據領先地位,而且在配置方面進行了大幅升級,堪稱脫胎換骨之作。據王騰劇透信息及相關爆...
王騰回應REDMI何時用玄戒芯片:急不來 成本太高 - 天天要聞

王騰回應REDMI何時用玄戒芯片:急不來 成本太高

站長之家(ChinaZ.com)5月28日 消息:近日,小米玄戒O1自研芯片發佈後收穫頗高熱度,然而小米15S Pro因定價略高,讓不少用戶望而卻步,眾多網友紛紛期待玄戒芯片能下放到REDMI機型,以降低產品價格。針對這一呼聲,王騰今日發佈視頻作出回應,直言「我們真的急不來」。王騰解釋稱,玄戒O1芯片初期研發成本高達135億元,分攤...