9191久久,四虎剧院永久,中文字幕一区二区三区门四区五区

世界模型新突破！智元機器人開源EVAC框架與EWMBench評測基準 發(fā)布時間：2025-05-22 17:09:39

導(dǎo) 言

當(dāng)前具身智能研發(fā)正面臨“雙重枷鎖”：一方面，真機驗證成本高、仿真偏差大，制約策略驗證效率；另一方面，海量真機數(shù)據(jù)尚未構(gòu)建基于軌跡擴增的高效利用機制，導(dǎo)致數(shù)據(jù)未被充分利用，制約了模型的持續(xù)進化。為打破這一困局，智元機器人在去年發(fā)布的具身4D世界模型基礎(chǔ)上【點擊文字回顧相關(guān)內(nèi)容】，進一步創(chuàng)新迭代，推出動作序列驅(qū)動的世界模型框架 EVAC（EnerVerse-AC），同時配套提出全球首個具身世界模型評測基準 EWMBench，構(gòu)建從世界模型從訓(xùn)練到評測的全鏈路閉環(huán)。另外，這兩大創(chuàng)新成果現(xiàn)已全面開源，EVAC也成為全球頂尖機器人賽事 AgiBot World Challenge @ IROS 2025【點擊文字跳轉(zhuǎn)相關(guān)文章】的baseline之一。

近日，智元機器人重磅發(fā)布具身智能領(lǐng)域雙重里程碑式突破：全球首個基于機器人動作序列驅(qū)動的具身世界模型EVAC (EnerVerse-AC)，以及具身世界模型評測基準EWMBench。這兩大創(chuàng)新成果現(xiàn)已全面開源，旨在構(gòu)建“低成本模擬 - 標準化評測 - 高效迭代”的全新開發(fā)范式，持續(xù)賦能全球具身智能研究，加速技術(shù)落地與產(chǎn)業(yè)發(fā)展。

? EVAC arxiv：

https://arxiv.org/abs/2505.09723

?EVAC 開源代碼：

https://github.com/AgibotTech/EnerVerse-AC

? EWMBench arxiv:

https://arxiv.org/abs/2505.09694

?EWMBench 開源代碼：

https://github.com/AgibotTech/EWMBench

直面行業(yè)瓶頸

破解具身智能研發(fā)的 “雙重枷鎖”

當(dāng)前具身智能演進面臨兩大關(guān)鍵制約：在測試階段，真機驗證代價大、風(fēng)險高，仿真系統(tǒng)又受制于虛實偏差；在數(shù)據(jù)層面，海量真機數(shù)據(jù)尚未構(gòu)建基于軌跡擴增的高效利用機制，限制了多樣性生成與泛化訓(xùn)練。為打破困局，智元機器人依托深厚的技術(shù)積累，精準洞察行業(yè)痛點，在去年發(fā)布的世界模型架構(gòu)EnerVerse基礎(chǔ)上推出創(chuàng)新成果：基于動作序列驅(qū)動的世界模型 EVAC與具身世界模型評測榜單 EWMBench，構(gòu)建從訓(xùn)練到評測全鏈路技術(shù)閉環(huán)，重新定義具身智能研發(fā)范式。

技術(shù)突破：EVAC——

全球首個機器人動作序列驅(qū)動的世界模型

EVAC 是一個能夠動態(tài)復(fù)現(xiàn)機器人與環(huán)境復(fù)雜交互的世界模型，標志著從傳統(tǒng)仿真到生成式模擬的躍遷。

▍核心能力：從 “物理執(zhí)行” 到“像素空間”的精準映射

EVAC基于前序工作 EnerVerse 架構(gòu)持續(xù)演進，創(chuàng)新型引入多級動作條件注入機制，實現(xiàn) “物理動作 - 視覺動態(tài)” 的端到端生成，其核心能力體現(xiàn)在以下幾個方面：

? 機器人動作與像素的高精度對齊：將機械臂 6D 位姿（x,y,z,roll,pitch,yaw）與末端執(zhí)行器行程投影為action map，確保物理動作與圖像幀的像素級對齊，精準建模 “抓取”、“放置”、“碰撞”、“推拉”、“快速拋擲”、“緩慢搖晃” 等復(fù)雜動力學(xué)行為；

? 動態(tài)多視圖建模：引入Ray Map編碼相機運動軌跡，支持頭部、腕部等多視角協(xié)同生成一致且連貫的視覺場景，賦予機器人更全面的環(huán)境生成能力。；

? 卓越的長時序一致性：采用 Chunk-Wise 自回歸擴散架構(gòu)與稀疏記憶機制（Sparse Memory），EVAC能夠?qū)崿F(xiàn)單視圖穩(wěn)定生成長達 30 個連續(xù)片段、多視圖下亦可維持 10 個連續(xù)片段的無漂移穩(wěn)定輸出，保證了模擬過程在時間軸上的連貫性與真實性；

? 數(shù)據(jù)高效利用：融合 Agibot-World 數(shù)據(jù)集 + 失敗軌跡（如抓取滑脫、路徑碰撞）提升生成質(zhì)量，該策略能有效抑制幻覺現(xiàn)象，使模型能更合理、更全面地建模機器人與環(huán)境的交互動態(tài)。

▍雙重價值：生成式仿真評估+數(shù)據(jù)引擎雙輪驅(qū)動

生成式仿真評測：

針對真機評測成本高、風(fēng)險大、難以復(fù)現(xiàn)等痛點，EVAC開創(chuàng)性地提出了生成式模擬評測方案，它能與待評測的策略模型進行交替推理，構(gòu)建起一套完整的交互式評測管線。實驗顯示，在多個任務(wù)中，EVAC所生成的評測結(jié)果與真機評測的成功率具有高度一致性，甚至能夠可靠地識別出性能更優(yōu)的模型權(quán)重，大幅提升了策略模型的篩選效率。

數(shù)據(jù)增廣引擎：

EVAC 能夠基于極少量的專家軌跡數(shù)據(jù)，通過動作插值與高保真畫面生成技術(shù)進行大規(guī)模數(shù)據(jù)增廣。應(yīng)用結(jié)果表明，采用EVAC數(shù)據(jù)增廣數(shù)據(jù)訓(xùn)練的策略模型，其任務(wù)成功率提升高達29%，目標跟隨性得到顯著改善，驗證了這一方案在具身智能研究中的實用性與高性價比。

具身世界模型評測基準

EWMBench——打造具身世界模型的

“質(zhì)檢尺”

為了科學(xué)、系統(tǒng)地衡量具身世界模型的性能表現(xiàn)，智元機器人推出了全球首個具身世界模型評測基準——EWMBench，旨在填補行業(yè)空白，構(gòu)建統(tǒng)一、可信的評測標準。

▍三維度評估體系：場景 × 動作 × 語義的立體考核

針對機器人操作場景的復(fù)雜性與特殊性，EWMBench構(gòu)建了立體化的評估體系，從場景一致性、動作合理性與語義對齊與多樣性三大核心指標進行分析：

場景一致性Scene Consistency：

評估生成場景中背景/物體/視角等穩(wěn)固度與真實性，采用微調(diào)過的DINOv2特征進行量化。

動作合理性Motion Correctness：

利用HSD (Symmetric Hausdorff Distance), nDTW (normalized Dynamic Time Warping) 和 Dynamics Score 三重互補指標協(xié)同精確評估生成動作的合理性與動力學(xué)真實度。

語義對齊與多樣性Semantic Alignment & Diversity：
結(jié)合MLLM(多模態(tài)大模型）和CLIP從全局指令對齊度、關(guān)鍵步驟語義準確性、邏輯合理性等多個層次對生成視頻進行語義理解評估。

▍權(quán)威數(shù)據(jù)支撐與便捷開源工具

? 基準數(shù)據(jù)集：EWMBench 基于行業(yè)領(lǐng)先的開源百萬真機數(shù)據(jù)集 Agibot-World 構(gòu)建，涵蓋了家居、工業(yè)、醫(yī)療三大場景的 10 類典型機器人操作任務(wù)和剛體 / 柔體 / 流體 / 關(guān)節(jié)物體等多種交互對象，其中包含超過 300個精心設(shè)計的測試樣本及 30% 挑戰(zhàn)性場景（低光照 / 部分遮擋），全面驗證模型在復(fù)雜環(huán)境下的魯棒性。

? 開源評測工具：智元機器人同步開源了全流程評測工具，支持一鍵生成標準化對比報告，大幅降低評估門檻，方便研究者快速開展模型比較與性能分析，加速實驗驗證與成果復(fù)現(xiàn)。

▍卓越評測性能：更貼近人類主觀感知

相較于當(dāng)前主流視頻生成評測基準 VBench，EWMBench 在評測結(jié)果與人類主觀判斷的一致性方面表現(xiàn)更優(yōu)，能夠更真實、細致地反映具身世界模型在交互理解、動作還原與視覺一致性等核心維度的實際能力。

協(xié)同效應(yīng)：

EnerVerse X EVAC × EWMBench 的

“螺旋進化”

EnerVerse 作為強大的世界模型基礎(chǔ)架構(gòu)，為 EVAC 提供可靠的基礎(chǔ)框架與預(yù)訓(xùn)練能力，而 EVAC 生成的多樣化高質(zhì)量數(shù)據(jù)又能反哺 EnerVerse 模型的持續(xù)優(yōu)化，二者形成 “訓(xùn)練 - 驗證” 技術(shù)閉環(huán)，不斷推動模型性能突破。通過 EWMBench 提供的精細化、多維度量化分析，研發(fā)團隊可以精準定位 EVAC 在處理如 “多物體交互”“動態(tài)環(huán)境避障” 等復(fù)雜場景的潛在不足，從而進行更具針對性的優(yōu)化。

EVAC 與 EWMBench 組合方案，已正式入選 AgiBot World Challenge @ IROS 2025 – World Model賽道的官方基線系統(tǒng)與評測標準。對于致力于具身智能世界模型研究的開發(fā)者和團隊而言，提供了一個寶貴的實踐與驗證平臺。我們鼓勵有興趣的同行關(guān)注并參與此項挑戰(zhàn)賽。參賽者將有機會：利用EVAC開源代碼與模型權(quán)重，訓(xùn)練、調(diào)優(yōu)具身世界模型；通過EWMBench全面的評測維度和標準化工具，客觀評估其世界模型的性能；在統(tǒng)一的基準下與全球研究者交流、比較和迭代各自的創(chuàng)新方法。AgiBot World Challenge @IROS 2025旨在促進具身智能領(lǐng)域的前沿探索與技術(shù)交流，期待通過這一平臺見證更多富有創(chuàng)造力的成果。

具身世界模型 EVAC和具身世界模型評測基準 EWMBench的發(fā)布和開源，將全面破解模型評測成本高和數(shù)據(jù)價值未充分挖掘利用的行業(yè)痛點，標志著具身智能進入“算法 - 評測” 協(xié)同進化時代。智元機器人也將持續(xù)踐行具身智能生態(tài)發(fā)展的創(chuàng)新和協(xié)作，持續(xù)推動前沿技術(shù)開源，引領(lǐng)具身智能邁向更高效、更普適的未來。

上一篇

下一篇