AI资讯新闻榜单内容搜索-模型竞技场

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型竞技场
Llama 4重测竞技场排名大跳水,网友:社区很难再信任Meta了

Llama 4重测竞技场排名大跳水,网友:社区很难再信任Meta了

Llama 4重测竞技场排名大跳水,网友:社区很难再信任Meta了

Llama 4被曝在大模型竞技场作弊后,重新上架了非特供版模型。但是你很可能没发现它。因为排名一下子从第2掉到了第32,要往下翻好久才能看到。

来自主题: AI资讯
7788 点击    2025-04-12 12:19
DeepSeek逼出谷歌新推理模型:40分优势超GPT4.5登顶竞技场,支持原生多模态,但依然败给了“竹竿问题”

DeepSeek逼出谷歌新推理模型:40分优势超GPT4.5登顶竞技场,支持原生多模态,但依然败给了“竹竿问题”

DeepSeek逼出谷歌新推理模型:40分优势超GPT4.5登顶竞技场,支持原生多模态,但依然败给了“竹竿问题”

又双叒,抢在OpenAI直播之前,谷歌Gemini 2.5系列来了。首个版本Pro Experimental一登场就抢下大模型竞技场第一名,并且整整比GPT-4.5高出40分Gemini 2.5同样是推理模型,用Jeff Dean的说法是:

来自主题: AI资讯
6810 点击    2025-03-26 08:40
GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人

GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人

GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人

在知名AI排行榜LM Arena中,曾全班垫底的GPT-4.5竟一度拿下第一?甚至在数学、编程等领域表现优异,这反常的表现让网友们一度质疑:大模型竞技场莫非被LLM操纵了?不过网友们在实测后却惊讶发现,GPT-4.5的确情商爆表,不用推理就能理解人类的深层意图!

来自主题: AI资讯
5963 点击    2025-03-05 13:31
GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭

GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭

GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭

基础模型竞争又紧张刺激起来了!GPT-4.5刚登顶竞技场且全任务分类第一名,6小时后总榜就被马斯克的新版Grok-3反超。两者都是获得3000+票数,总分1412:1411只差一分。

来自主题: AI资讯
5963 点击    2025-03-04 13:11