AI资讯新闻榜单内容搜索-模型排行

黑马！大模型竞技场榜单更新，国产玩家首次进入全球总榜前10

龙争虎斗的大模型竞技场，今天突然更新：国内大模型公司零一万物旗下的Yi-Large千亿参数闭源大模型，跃升总榜第七，也成为榜上国产大模型第一。可以看到，它的成绩几乎与GPT-4-0125-preview持平。同时，国内清华系大模型公司智谱华章的GLM-4-0116也杀进总榜，位居第15位。

来自主题: AI资讯

7437 点击 2024-05-21 19:37

上周，一个名为 “im-also-a-good-gpt2-chatbot” 的神秘模型突然现身大模型竞技场 Chatbot Arena

来自主题: AI资讯

11953 点击 2024-05-21 15:53

真正与GPT-4o齐头并进的国产大模型来了！刚刚，LMSYS揭开最新榜单，黑马Yi-Large在中文分榜上与GPT-4o并列第一，而在总榜上位列世界第七，紧追国际第一阵营，并登上了国内大模型盲测榜首。

来自主题: AI资讯

12097 点击 2024-05-21 14:55

最公平的大模型基准测试诞生了！来自LLM竞技场，最接近人类偏好，数据新鲜、速度快、成本低，严格分离学渣和学霸。

来自主题: AI技术研报

12229 点击 2024-05-20 16:20

2024年5月17日，智源研究院举办大模型评测发布会，正式推出科学、权威、公正、开放的智源评测体系，发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。

来自主题: AI资讯

12071 点击 2024-05-17 17:25

关于Llama 3，又有测试结果新鲜出炉—— 大模型评测社区LMSYS发布了一份大模型排行榜单，Llama 3位列第五，英文单项与GPT-4并列第一。

来自主题: AI资讯

10764 点击 2024-04-23 14:20

Claude 3不但数据集跑分领先，用户体验上也将成为最强大的LLM，GPT-5在哪里？

来自主题: AI资讯

9191 点击 2024-03-24 21:24

HuggingFace开源大模型排行榜，又被屠榜了。

来自主题: AI资讯

7863 点击 2023-12-29 17:27