AI资讯新闻榜单内容搜索-AI排行榜

谁是AI之王？聊聊备受争议的AI评测与崛起的LMArena

当AI模型排行榜开始被各种刷分作弊之后，谁家大模型最牛这个问题就变得非常主观，直到一家线上排行榜诞生，它叫：LMArena。在文字、视觉、搜索、文生图、文生视频等不同的AI大模型细分领域，LMArena上每天都有上千场的实时对战，由普通用户来匿名投票选出哪一方的回答更好。

来自主题: AI资讯

9507 点击 2025-11-03 09:41

LM Arena 是一个众包基准测试项目，各大 AI 实验室依赖其测试和推广自家 AI 模型。据彭博社报道，该项目已在种子轮融资中筹集 1 亿美元，估值达 6 亿美元。

来自主题: AI资讯

9690 点击 2025-05-22 16:00

你信任的AI排行榜，可能只是一场精心策划的骗局！震惊业界的Cohere Labs最新研究彻底撕破了Chatbot Arena这一所谓"黄金标准"的华丽面纱，揭露了科技巨头们如何肆无忌惮地操控评估系统、掠夺社区资源、扼杀开源创新。

来自主题: AI技术研报

9463 点击 2025-05-06 15:00

在知名AI排行榜LM Arena中，曾全班垫底的GPT-4.5竟一度拿下第一？甚至在数学、编程等领域表现优异，这反常的表现让网友们一度质疑：大模型竞技场莫非被LLM操纵了？不过网友们在实测后却惊讶发现，GPT-4.5的确情商爆表，不用推理就能理解人类的深层意图！

来自主题: AI资讯

7971 点击 2025-03-05 13:31

能打得过GPT-4的开源模型出现了！

来自主题: AI资讯

8652 点击 2024-04-10 13:28

太疯狂了！Claude 3 Opus竟然干掉了GPT-4。在Chatbot Arena最新的聊天机器人对战排行榜中，Claude 3的超大杯成功登顶，就连最小的Claude 3 HaiKu都达到了GPT-4水平！

来自主题: AI资讯

6714 点击 2024-03-27 17:47

GPT-4真的被反超了！大模型竞技场上，Claude 3大杯Opus新王登基，Elo分数来到榜首。

来自主题: AI资讯

9338 点击 2024-03-27 17:35