刚刚,智元拿下WorldArena世界模型总分冠军!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
刚刚,智元拿下WorldArena世界模型总分冠军!
8765点击    2026-05-29 21:42

WorldArena 世界模型赛道从来都是竞争异常激烈,在经历了前几次比赛过程中的放榜之后,CVPR 2026 WorldArena 世界模型赛道锁定总成绩,智元自研的世界模型 Genie Envisioner-Sim 2.0(以下简称 GE 2.0)拿下了最终的冠军,成为了 “强者中的强者”。


刚刚,智元拿下WorldArena世界模型总分冠军!


WorldArena 是目前世界模型赛道最权威的榜单,拥有最严苛的评测基准,构建了包含 16 项细分核心指标和 3 大真实应用任务的立体评估体系,旨在对具身世界模型的感知精度、物理规律理解、三维空间认知以及动作预测与落地能力进行最严苛的考察。由于其极高的学术严谨性与行业公信力,WorldArena 吸引了全球几乎所有头部世界模型团队同台竞技。


在该赛道评测中,智元团队使用了原生的世界模型 GE 2.0,并未针对赛题进行特殊设计优化,仅基于榜单数据进行了基础微调(Finetune)。“轻装上阵” 依然拔得头筹,充分印证了 GE 2.0 强大的通用适配性。面对近期世界模型方向的火热关注和创业浪潮,智元始终保持自己的节奏,从长远第一性原理出发 ,专注于打磨具身世界模型的坚实技术底座。此次登顶,是智元坚持长期技术演进的实力见证。


刚刚,智元拿下WorldArena世界模型总分冠军!


  • 项目链接:https://ge-sim-v2.github.io/
  • Arxiv:https://arxiv.org/abs/2605.27491
  • Github:https://github.com/AgibotTech/GE-Sim-V2


裸考封神


智元 GE 2.0 模型实力登顶


没有针对 WorldArena 进行特别调优,裸考出战依然断层领跑。在 GE 2.0 技术报告中,智元团队对模型进行了全面的能力剖析。相比上一代模型,GE 2.0 不仅在单点性能上实现了跃升,更真正演进为一个全功能、高可用的世界模拟器,构建可试错、可迭代、可进化的虚拟仿真环境,让机器人策略在虚拟场景中自主积累经验、完成动态试错,规避真实场景的试错成本,最终高效迁移至真实物理世界稳定落地,真正实现从 “感知预测” 到 “仿真进化、自主决策” 的闭环升级。


功能矩阵全面补齐:GE 2.0 在功能上首次全面覆盖了长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等核心环节,构建了世界模拟器完整的技术能力闭环。


刚刚,智元拿下WorldArena世界模型总分冠军!


长时序推演能力突破: 在长时序推理任务中,GE 2.0 表现出极强的稳定性,画面质量随推理时长的衰减显著弱于行业基线方案。即使在连续推演 40-50 秒的长视频片段时,其生成质量依然超越了基线模型前 10 秒内的表现。


刚刚,智元拿下WorldArena世界模型总分冠军!


高可靠的闭环评测:作为世界模拟器,核心在于能否真实反映物理世界。团队验证了大量闭环评测结果,证明 GE 2.0 在多项任务上均与真实世界保持着强相关性。这种相关性不止步于宏观统计意义上的 “成功率一致”,团队还进行了逐案(Case-by-case)的 rollout 结果对比分析,并通过混淆矩阵(Confusion Matrix)提供了严谨的量化佐证,强有力地证明了 GE 2.0 作为策略评测器的可靠性。


刚刚,智元拿下WorldArena世界模型总分冠军!


打通数据回流反哺机制:在奖励模型(Reward Model)的加持下,GE 2.0 能够对闭环评测的 rollout 过程进行自动化筛选,将世界模型中产出的有效高质量数据精准回流给策略模型(Policy Model)。实验证明,这一机制在多项任务上均助力策略模型实现了显著的性能涨点。


刚刚,智元拿下WorldArena世界模型总分冠军!


从技术沉淀来看,智元 GE 2.0 的登顶,是长期深耕底层算法、打磨物理 AI 核心能力的必然结果。相较于行业同类模型,该模型实现了全方位技术跃升,不仅补齐长时序稳定推演、多视角精准生成、实时物理还原、闭环奖励判别等全维度能力,更突破传统模型 “重视觉、轻物理、难落地” 的行业痛点。即便在 40-50 秒超长时序复杂场景推演中,依旧能保持画面稳定、物理逻辑精准、空间结构无偏差,生成数据可直接反哺机器人策略模型迭代,真正实现从 “视觉拟真” 到 “物理可信、可用、可落地” 的质变,算法通用性、稳定性、实用性全面领先行业水平。


ALL IN AI


智元定位 “具身智能的基础模型公司”


区别于行业多数聚焦机器人硬件整机、场景应用或单点技术优化的企业,智元坚定锚定具身智能基础模型公司核心定位,核心逻辑不在于制造机器人本体,而在于打造支撑整个物理 AI 行业发展的底层基础设施与通用基础能力。不同于单点应用技术的迭代,智元深耕通用具身基础模型,打造可适配全场景、可通用泛化、可自主进化的底层 AI 能力,为机器人的运动、感知、决策、作业提供核心大脑。


今年 4 月,智元连续一周进行了 “ALL IN AI” 智元 AI WEEK 成果发布,完成了开源数据集、开源仿真平台、基座大模型、世界仿真器、机器人部署应用平台五大核心维度的完整技术闭环搭建,构建了行业独一份的 “数据筑基 — 仿真赋能 — 模型进化 — 应用落地 — 生态开放” 全链路能力体系,彻底摆脱单点技术短板,成为具身智能领域全能型战士。


  • AGIBOT WORLD 2026:首个系统性覆盖具身智能全域研究的开源数据集
  • Genie Sim 3.0:首个大语言模型驱动的仿真开发平台
  • Genie Operator-2:通用具身基座大模型,定义 “知行合一” 新高度
  • Genie Envisioner 2.0:世界模型驱动的环境模拟器
  • Genie Studio Agent:面向具身作业场景的零代码 Agent 应用平台


当前行业普遍存在数据质量参差不齐、仿真成本高、模型落地难、部署门槛高的痛点,智元通过全栈基础技术布局,打通了完整价值闭环,解决了制约行业发展的共性底层难题。同时,智元坚持 ALL IN AI 的核心战略,所有技术迭代均围绕通用基础能力升级,而非单一场景定制优化,其技术成果可覆盖全品类机器人、全行业物理作业场景,具备极强的产业赋能属性,真正承担起具身智能领域基础底座搭建者、行业标准定义者的角色,也是智元能够拿下世界模型赛道全球总冠军、持续领跑物理 AI 的核心根源。


真正的通用机器人,离不开硬件本体与智能系统的深度协同,更需要全栈自研的 AI 能力体系作为坚实底座。具身智能的未来,不在于零散的单点创新,而在于可持续进化、可协同放大的系统性能力。从建成全球首个 3000 平方米机器人实景数据采集场地,到推出一站式仿真开发平台 Genie Sim;从通用具身基础模型 Genie Operator 1,到实现对物理世界深度理解的世界模型 Genie Envisioner;再到面向全量开发者的具身智能一站式开发平台 Genie Studio:智元持续构建面向物理 AI 的完整能力底座,打通技术价值闭环,让每一项 AI 能力都成为推动机器人迈向 “部署态” 的坚实支撑。


锚定 “部署态”


让具身智能从炫技走向商用闭环


部署态是今年智元在 2026APC 合作伙伴大会上提出来的概念,智元依托全栈技术闭环,实现机器人在真实复杂场景中大规模稳定作业、持续迭代,具备可落地、可复用特质,真正标志着具身智能从技术演示迈向规模化商用新阶段。


成功实施 “部署态” 的核心在于底层算法的演进,智元 ALL IN AI 的核心逻辑始终围绕真实物理世界、真实作业需求、真实商用落地,全部服务于机器人规模化部署:真实场景数据集保证模型适配复杂真实环境;生成式仿真大幅降低试错成本;基座模型保障作业精准稳定;世界模型提升复杂任务自主决策能力;零代码平台彻底解决落地难、复制难、迭代难的产业痛点,实现技术价值到产业价值的完整闭环。


一次裸考登顶,是实力的印证;持续全域领跑,是强者的常态。智元本次登顶 WorldArena 世界模型总分冠军,是智元长期坚持 All in AI 战略的成果。算法是未来具身智能产业的竞争核心,只有持续迭代世界模型、基座大模型等核心算法能力,深化虚实融合技术闭环,才能在具身智能这条长跑之路上,不断引领向前。


文章来自于微信公众号 "机器之心",作者 "机器之心"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner