AI资讯新闻榜单内容搜索-Arena

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Arena
Qwen3.6-Plus 深度测评报告

Qwen3.6-Plus 深度测评报告

Qwen3.6-Plus 深度测评报告

本报告基于XSCT Arena平台,对 Qwen3.6-Plus-Preview(阿里云,2026-04-02 发布)在文字能力(xsct-l)、网页生成(xsct-w)、Agentic 任务(xsct-a)三大场景下的表现进行系统评测,并与Claude Sonnet 4.6、GPT-5.4、Gemini 3.1 Pro、Kimi K2.5、

来自主题: AI产品测评
9606 点击    2026-04-04 16:19
力压李飞飞团队登顶WorldScore,黑马Manifold AI领跑世界动作模型新范式

力压李飞飞团队登顶WorldScore,黑马Manifold AI领跑世界动作模型新范式

力压李飞飞团队登顶WorldScore,黑马Manifold AI领跑世界动作模型新范式

通用世界模型评测榜单 WorldScore 登顶、建立具身世界模型评测榜单 WorldArena 、发布通用世界模型 WorldScape 、发布世界-动作模型 WorldScape Policy,这家低调的世界模型创业公司 Manifold AI(流形空间)近期走出隐身模式频频出手,开始领跑世界-动作模型具身新路线。

来自主题: AI资讯
8671 点击    2026-04-04 11:03
林俊旸离职后,阿里Qwen3.5首次发新

林俊旸离职后,阿里Qwen3.5首次发新

林俊旸离职后,阿里Qwen3.5首次发新

今日,阿里千问最新旗舰模型预览版Qwen3.5-Max-Preview正式亮相,并登上全球大模型评测平台LMArena。在最新榜单中,该模型拿下1464分,进入第一梯队,同时带动阿里千问跻身全球大模型实验室前五、国内第一。

来自主题: AI资讯
8501 点击    2026-03-20 14:40
更全面的具身智能真机评测来了!CVPR 2026 ManipArena挑战赛邀你打榜

更全面的具身智能真机评测来了!CVPR 2026 ManipArena挑战赛邀你打榜

更全面的具身智能真机评测来了!CVPR 2026 ManipArena挑战赛邀你打榜

过去一年,具身智能领域迎来了爆发式增长。从后空翻到托马斯回旋,从整理衣物到冲泡咖啡……各类令人惊艳的机器人演示视频层出不穷。

来自主题: AI技术研报
10738 点击    2026-03-19 09:46
训练机器人方式对了吗?英伟达DreamZero双榜第一新反思

训练机器人方式对了吗?英伟达DreamZero双榜第一新反思

训练机器人方式对了吗?英伟达DreamZero双榜第一新反思

近日,NVIDIA 发布的世界 - 动作模型 DreamZero,在两项颇具代表性的机器人基准测试 RoboArena 、MolmoSpaces 上双双登顶。

来自主题: AI技术研报
10080 点击    2026-03-04 14:32
46.5万次盲测封王!Grok视频模型屠榜Arena,谷歌最强对手来了

46.5万次盲测封王!Grok视频模型屠榜Arena,谷歌最强对手来了

46.5万次盲测封王!Grok视频模型屠榜Arena,谷歌最强对手来了

xAI的Grok图像转视频模型(grok-image-video-720p)登顶「Image-to-Video Arena」排行榜,以1404分的超高ELO评分力压群雄,位居第一。马斯克亲自发帖为自家Grok Image模型站台,称它每周都在迭代优化。

来自主题: AI资讯
11609 点击    2026-02-25 15:07
ICLR 2026 oral | AI代码真能进生产环境?SwingArena:从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境?SwingArena:从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境?SwingArena:从「写对代码Commit」到「通过CI审查」

过去一年,大模型写代码的能力几乎以肉眼可见的速度提升。从简单脚本到完整功能模块,GPT、Claude、DeepSeek 等模型已经能够在几秒钟内生成看起来相当 “专业” 的代码。

来自主题: AI技术研报
8278 点击    2026-02-12 14:56
2.4万亿参数量文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?

2.4万亿参数量文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?

2.4万亿参数量文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?

在文心Moment大会上,文心大模型5.0正式版上线。据称,该模型参数量达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。

来自主题: AI资讯
8798 点击    2026-01-24 11:03