刚刚，智元拿下WorldArena世界模型总分冠军！

9689点击 2026-05-29 21:42

WorldArena 世界模型赛道从来都是竞争异常激烈，在经历了前几次比赛过程中的放榜之后，CVPR 2026 WorldArena 世界模型赛道锁定总成绩，智元自研的世界模型 Genie Envisioner-Sim 2.0（以下简称 GE 2.0）拿下了最终的冠军，成为了 “强者中的强者”。

WorldArena 是目前世界模型赛道最权威的榜单，拥有最严苛的评测基准，构建了包含 16 项细分核心指标和 3 大真实应用任务的立体评估体系，旨在对具身世界模型的感知精度、物理规律理解、三维空间认知以及动作预测与落地能力进行最严苛的考察。由于其极高的学术严谨性与行业公信力，WorldArena 吸引了全球几乎所有头部世界模型团队同台竞技。

在该赛道评测中，智元团队使用了原生的世界模型 GE 2.0，并未针对赛题进行特殊设计优化，仅基于榜单数据进行了基础微调（Finetune）。“轻装上阵” 依然拔得头筹，充分印证了 GE 2.0 强大的通用适配性。面对近期世界模型方向的火热关注和创业浪潮，智元始终保持自己的节奏，从长远第一性原理出发，专注于打磨具身世界模型的坚实技术底座。此次登顶，是智元坚持长期技术演进的实力见证。

刚刚，智元拿下WorldArena世界模型总分冠军！

项目链接：https://ge-sim-v2.github.io/
Arxiv：https://arxiv.org/abs/2605.27491
Github：https://github.com/AgibotTech/GE-Sim-V2

裸考封神

智元 GE 2.0 模型实力登顶

没有针对 WorldArena 进行特别调优，裸考出战依然断层领跑。在 GE 2.0 技术报告中，智元团队对模型进行了全面的能力剖析。相比上一代模型，GE 2.0 不仅在单点性能上实现了跃升，更真正演进为一个全功能、高可用的世界模拟器，构建可试错、可迭代、可进化的虚拟仿真环境，让机器人策略在虚拟场景中自主积累经验、完成动态试错，规避真实场景的试错成本，最终高效迁移至真实物理世界稳定落地，真正实现从 “感知预测” 到 “仿真进化、自主决策” 的闭环升级。

功能矩阵全面补齐：GE 2.0 在功能上首次全面覆盖了长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等核心环节，构建了世界模拟器完整的技术能力闭环。

刚刚，智元拿下WorldArena世界模型总分冠军！

长时序推演能力突破：在长时序推理任务中，GE 2.0 表现出极强的稳定性，画面质量随推理时长的衰减显著弱于行业基线方案。即使在连续推演 40-50 秒的长视频片段时，其生成质量依然超越了基线模型前 10 秒内的表现。

刚刚，智元拿下WorldArena世界模型总分冠军！

高可靠的闭环评测：作为世界模拟器，核心在于能否真实反映物理世界。团队验证了大量闭环评测结果，证明 GE 2.0 在多项任务上均与真实世界保持着强相关性。这种相关性不止步于宏观统计意义上的 “成功率一致”，团队还进行了逐案（Case-by-case）的 rollout 结果对比分析，并通过混淆矩阵（Confusion Matrix）提供了严谨的量化佐证，强有力地证明了 GE 2.0 作为策略评测器的可靠性。

刚刚，智元拿下WorldArena世界模型总分冠军！

打通数据回流反哺机制：在奖励模型（Reward Model）的加持下，GE 2.0 能够对闭环评测的 rollout 过程进行自动化筛选，将世界模型中产出的有效高质量数据精准回流给策略模型（Policy Model）。实验证明，这一机制在多项任务上均助力策略模型实现了显著的性能涨点。

刚刚，智元拿下WorldArena世界模型总分冠军！

从技术沉淀来看，智元 GE 2.0 的登顶，是长期深耕底层算法、打磨物理 AI 核心能力的必然结果。相较于行业同类模型，该模型实现了全方位技术跃升，不仅补齐长时序稳定推演、多视角精准生成、实时物理还原、闭环奖励判别等全维度能力，更突破传统模型 “重视觉、轻物理、难落地” 的行业痛点。即便在 40-50 秒超长时序复杂场景推演中，依旧能保持画面稳定、物理逻辑精准、空间结构无偏差，生成数据可直接反哺机器人策略模型迭代，真正实现从 “视觉拟真” 到 “物理可信、可用、可落地” 的质变，算法通用性、稳定性、实用性全面领先行业水平。

ALL IN AI

智元定位 “具身智能的基础模型公司”

区别于行业多数聚焦机器人硬件整机、场景应用或单点技术优化的企业，智元坚定锚定具身智能基础模型公司核心定位，核心逻辑不在于制造机器人本体，而在于打造支撑整个物理 AI 行业发展的底层基础设施与通用基础能力。不同于单点应用技术的迭代，智元深耕通用具身基础模型，打造可适配全场景、可通用泛化、可自主进化的底层 AI 能力，为机器人的运动、感知、决策、作业提供核心大脑。

今年 4 月，智元连续一周进行了 “ALL IN AI” 智元 AI WEEK 成果发布，完成了开源数据集、开源仿真平台、基座大模型、世界仿真器、机器人部署应用平台五大核心维度的完整技术闭环搭建，构建了行业独一份的 “数据筑基 — 仿真赋能 — 模型进化 — 应用落地 — 生态开放” 全链路能力体系，彻底摆脱单点技术短板，成为具身智能领域全能型战士。

AGIBOT WORLD 2026：首个系统性覆盖具身智能全域研究的开源数据集
Genie Sim 3.0：首个大语言模型驱动的仿真开发平台
Genie Operator-2：通用具身基座大模型，定义 “知行合一” 新高度
Genie Envisioner 2.0：世界模型驱动的环境模拟器
Genie Studio Agent：面向具身作业场景的零代码 Agent 应用平台

当前行业普遍存在数据质量参差不齐、仿真成本高、模型落地难、部署门槛高的痛点，智元通过全栈基础技术布局，打通了完整价值闭环，解决了制约行业发展的共性底层难题。同时，智元坚持 ALL IN AI 的核心战略，所有技术迭代均围绕通用基础能力升级，而非单一场景定制优化，其技术成果可覆盖全品类机器人、全行业物理作业场景，具备极强的产业赋能属性，真正承担起具身智能领域基础底座搭建者、行业标准定义者的角色，也是智元能够拿下世界模型赛道全球总冠军、持续领跑物理 AI 的核心根源。

真正的通用机器人，离不开硬件本体与智能系统的深度协同，更需要全栈自研的 AI 能力体系作为坚实底座。具身智能的未来，不在于零散的单点创新，而在于可持续进化、可协同放大的系统性能力。从建成全球首个 3000 平方米机器人实景数据采集场地，到推出一站式仿真开发平台 Genie Sim；从通用具身基础模型 Genie Operator 1，到实现对物理世界深度理解的世界模型 Genie Envisioner；再到面向全量开发者的具身智能一站式开发平台 Genie Studio：智元持续构建面向物理 AI 的完整能力底座，打通技术价值闭环，让每一项 AI 能力都成为推动机器人迈向 “部署态” 的坚实支撑。

锚定 “部署态”

让具身智能从炫技走向商用闭环

部署态是今年智元在 2026APC 合作伙伴大会上提出来的概念，智元依托全栈技术闭环，实现机器人在真实复杂场景中大规模稳定作业、持续迭代，具备可落地、可复用特质，真正标志着具身智能从技术演示迈向规模化商用新阶段。

成功实施 “部署态” 的核心在于底层算法的演进，智元 ALL IN AI 的核心逻辑始终围绕真实物理世界、真实作业需求、真实商用落地，全部服务于机器人规模化部署：真实场景数据集保证模型适配复杂真实环境；生成式仿真大幅降低试错成本；基座模型保障作业精准稳定；世界模型提升复杂任务自主决策能力；零代码平台彻底解决落地难、复制难、迭代难的产业痛点，实现技术价值到产业价值的完整闭环。

一次裸考登顶，是实力的印证；持续全域领跑，是强者的常态。智元本次登顶 WorldArena 世界模型总分冠军，是智元长期坚持 All in AI 战略的成果。算法是未来具身智能产业的竞争核心，只有持续迭代世界模型、基座大模型等核心算法能力，深化虚实融合技术闭环，才能在具身智能这条长跑之路上，不断引领向前。

文章来自于微信公众号 "机器之心"，作者 "机器之心"

关键词: AI新闻 , WorldArena , Genie Envisioner-Sim 2.0 , 智元

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner