AI资讯新闻榜单内容搜索-LMArena

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LMArena
刚刚,Gemini 2.5 Pro升级,成编程模型新王

刚刚,Gemini 2.5 Pro升级,成编程模型新王

刚刚,Gemini 2.5 Pro升级,成编程模型新王

你的默认编程模型是什么?或许可以换一换了。刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。其最大的进步是编程能力大幅提升,不仅在 LMArena 编程排行榜上名列第一,同时也在 WebDev Arena 排行榜上更是以显著优势超过了昔日霸

来自主题: AI资讯
8981 点击    2025-05-07 09:22
AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥

AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥

AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥

刚刚,LMArena陷入了巨大争议,斯坦福MIT和Ai2等的研究者联手发论文痛斥,这个排行榜已经被Meta等公司利用暗中操作排名!Karpathy也下场帮忙锤了一把。而LMArena官方立马回应:论文存在多处错误,指控不实。

来自主题: AI资讯
7783 点击    2025-05-01 14:07
马斯克“地表最强”Grok 3炸场,竞技场首超1400分

马斯克“地表最强”Grok 3炸场,竞技场首超1400分

马斯克“地表最强”Grok 3炸场,竞技场首超1400分

刚刚,马斯克xAI的Grok 3终于亮相(超300万人次围观)!一出道即巅峰,竞技场(lmarena.ai)官方给出了这样的评价:Grok 3是首个突破1400分的模型,并且在所有类别中排名第一。

来自主题: AI资讯
7991 点击    2025-02-18 15:03