AI资讯新闻榜单内容搜索-Arena

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Arena

Qwen3.6-Plus 深度测评报告

Qwen3.6-Plus 深度测评报告

Qwen3.6-Plus 深度测评报告

本报告基于XSCT Arena平台，对 Qwen3.6-Plus-Preview（阿里云，2026-04-02 发布）在文字能力（xsct-l）、网页生成（xsct-w）、Agentic 任务（xsct-a）三大场景下的表现进行系统评测，并与Claude Sonnet 4.6、GPT-5.4、Gemini 3.1 Pro、Kimi K2.5、

来自主题: AI产品测评

9606 点击 2026-04-04 16:19

力压李飞飞团队登顶WorldScore，黑马Manifold AI领跑世界动作模型新范式

力压李飞飞团队登顶WorldScore，黑马Manifold AI领跑世界动作模型新范式

力压李飞飞团队登顶WorldScore，黑马Manifold AI领跑世界动作模型新范式

通用世界模型评测榜单 WorldScore 登顶、建立具身世界模型评测榜单 WorldArena 、发布通用世界模型 WorldScape 、发布世界-动作模型 WorldScape Policy，这家低调的世界模型创业公司 Manifold AI（流形空间）近期走出隐身模式频频出手，开始领跑世界-动作模型具身新路线。

来自主题: AI资讯

8671 点击 2026-04-04 11:03

国产世界模型登顶全球第一！断层领先谷歌英伟达，3D准确度逼近满分

国产世界模型登顶全球第一！断层领先谷歌英伟达，3D准确度逼近满分

国产世界模型登顶全球第一！断层领先谷歌英伟达，3D准确度逼近满分

还得是咱国产世界模型牛！

来自主题: AI技术研报

10330 点击 2026-03-30 16:07

林俊旸离职后，阿里Qwen3.5首次发新

林俊旸离职后，阿里Qwen3.5首次发新

林俊旸离职后，阿里Qwen3.5首次发新

今日，阿里千问最新旗舰模型预览版Qwen3.5-Max-Preview正式亮相，并登上全球大模型评测平台LMArena。在最新榜单中，该模型拿下1464分，进入第一梯队，同时带动阿里千问跻身全球大模型实验室前五、国内第一。

来自主题: AI资讯

8501 点击 2026-03-20 14:40

更全面的具身智能真机评测来了！CVPR 2026 ManipArena挑战赛邀你打榜

更全面的具身智能真机评测来了！CVPR 2026 ManipArena挑战赛邀你打榜

更全面的具身智能真机评测来了！CVPR 2026 ManipArena挑战赛邀你打榜

过去一年，具身智能领域迎来了爆发式增长。从后空翻到托马斯回旋，从整理衣物到冲泡咖啡……各类令人惊艳的机器人演示视频层出不穷。

来自主题: AI技术研报

10738 点击 2026-03-19 09:46

训练机器人方式对了吗？英伟达DreamZero双榜第一新反思

训练机器人方式对了吗？英伟达DreamZero双榜第一新反思

训练机器人方式对了吗？英伟达DreamZero双榜第一新反思

近日，NVIDIA 发布的世界 - 动作模型 DreamZero，在两项颇具代表性的机器人基准测试 RoboArena 、MolmoSpaces 上双双登顶。

来自主题: AI技术研报

10080 点击 2026-03-04 14:32

46.5万次盲测封王！Grok视频模型屠榜Arena，谷歌最强对手来了

46.5万次盲测封王！Grok视频模型屠榜Arena，谷歌最强对手来了

46.5万次盲测封王！Grok视频模型屠榜Arena，谷歌最强对手来了

xAI的Grok图像转视频模型（grok-image-video-720p）登顶「Image-to-Video Arena」排行榜，以1404分的超高ELO评分力压群雄，位居第一。马斯克亲自发帖为自家Grok Image模型站台，称它每周都在迭代优化。

来自主题: AI资讯

11609 点击 2026-02-25 15:07

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

过去一年，大模型写代码的能力几乎以肉眼可见的速度提升。从简单脚本到完整功能模块，GPT、Claude、DeepSeek 等模型已经能够在几秒钟内生成看起来相当 “专业” 的代码。

来自主题: AI技术研报

8278 点击 2026-02-12 14:56

上海交大给具身智能发了一张“统考卷”，这会是机器人的LMArena吗？

上海交大给具身智能发了一张“统考卷”，这会是机器人的LMArena吗？

上海交大给具身智能发了一张“统考卷”，这会是机器人的LMArena吗？

用多样化的任务与公开透明的机制，堵上具身大模型刷榜的捷径。

来自主题: AI资讯

10043 点击 2026-01-27 10:14

2.4万亿参数量文心5.0正式版发布，霸榜LMArena的“最强文科生”到底强在哪？

2.4万亿参数量文心5.0正式版发布，霸榜LMArena的“最强文科生”到底强在哪？

2.4万亿参数量文心5.0正式版发布，霸榜LMArena的“最强文科生”到底强在哪？

在文心Moment大会上，文心大模型5.0正式版上线。据称，该模型参数量达2.4万亿，采用原生全模态统一建模技术，具备全模态理解与生成能力，支持文本、图像、音频、视频等多种信息的输入与输出。

来自主题: AI资讯

8798 点击 2026-01-24 11:03

上一页当前第3页,共9页下一页