AI资讯新闻榜单内容搜索-Arena

中国大模型头名易主：全球盲测榜单上，Yi-Large与GPT-4o中文并列第一

上周，一个名为 “im-also-a-good-gpt2-chatbot” 的神秘模型突然现身大模型竞技场 Chatbot Arena

来自主题: AI资讯

11802 点击 2024-05-21 15:53

最公平的大模型基准测试诞生了！来自LLM竞技场，最接近人类偏好，数据新鲜、速度快、成本低，严格分离学渣和学霸。

来自主题: AI技术研报

12117 点击 2024-05-20 16:20

随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布，业界急需一款更难、更有区分度的基准测试。

来自主题: AI资讯

4949 点击 2024-04-22 20:58

太疯狂了！Claude 3 Opus竟然干掉了GPT-4。在Chatbot Arena最新的聊天机器人对战排行榜中，Claude 3的超大杯成功登顶，就连最小的Claude 3 HaiKu都达到了GPT-4水平！

来自主题: AI资讯

6738 点击 2024-03-27 17:47

“大模型排位赛”权威榜单Chatbot Arena刷新：谷歌Bard超越GPT-4，排名位居第二，仅次于GPT-4 Turbo。

来自主题: AI技术研报

8729 点击 2024-01-31 11:42