AI资讯新闻榜单内容搜索-Arena

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Arena
ICLR 2026 oral | AI代码真能进生产环境?SwingArena:从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境?SwingArena:从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境?SwingArena:从「写对代码Commit」到「通过CI审查」

过去一年,大模型写代码的能力几乎以肉眼可见的速度提升。从简单脚本到完整功能模块,GPT、Claude、DeepSeek 等模型已经能够在几秒钟内生成看起来相当 “专业” 的代码。

来自主题: AI技术研报
6909 点击    2026-02-12 14:56
2.4万亿参数量文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?

2.4万亿参数量文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?

2.4万亿参数量文心5.0正式版发布,霸榜LMArena的“最强文科生”到底强在哪?

在文心Moment大会上,文心大模型5.0正式版上线。据称,该模型参数量达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。

来自主题: AI资讯
7729 点击    2026-01-24 11:03
全球最大AI榜单塌房!52%高分答案全是胡扯,硅谷大厂集体造假?

全球最大AI榜单塌房!52%高分答案全是胡扯,硅谷大厂集体造假?

全球最大AI榜单塌房!52%高分答案全是胡扯,硅谷大厂集体造假?

谁能想到,AI界最权威的大模型排行榜,竟然是个彻头彻尾的骗局?最近,2025年底的一篇名为《LMArena is a cancer on AI》的文章被翻了出来。登上了Hacker News的首页,引起轩然大波!

来自主题: AI资讯
8046 点击    2026-01-09 11:35
网民票选AI王者,LMArena一夜变17亿美元独角兽!

网民票选AI王者,LMArena一夜变17亿美元独角兽!

网民票选AI王者,LMArena一夜变17亿美元独角兽!

一场AI界的《创造101》火了!LMArena让你盲投选出最强AI,三年从校园项目逆袭,刚刚融1.5亿美元,估值飙到17亿美元。众包投票挑战专家权威,争议四起,却已成行业标杆。你的票,就能决定下一个AI顶流!

来自主题: AI资讯
6722 点击    2026-01-07 18:38
美国模型长期霸榜的LMArena,出现了一个国产模型

美国模型长期霸榜的LMArena,出现了一个国产模型

美国模型长期霸榜的LMArena,出现了一个国产模型

时间过得太快了,一转眼就来到了 2025 年的年底。我们距离 2026 年只剩下了 8 天。回看 AI 模型和产品突飞猛进这一年,中美两家 AI 阵营的行业发展路径有了挺大的区分,大家的关注度不再是单一模型、单一能力,而是“模型+工程+场景”的复合能力。这个变化在年底愈发明显。

来自主题: AI资讯
9286 点击    2025-12-25 14:17
神秘模型Grok 4.20 AI炒股夺冠!只有它赚钱,吊打Gemini 3和GPT-5.1

神秘模型Grok 4.20 AI炒股夺冠!只有它赚钱,吊打Gemini 3和GPT-5.1

神秘模型Grok 4.20 AI炒股夺冠!只有它赚钱,吊打Gemini 3和GPT-5.1

在Alpha Arena 1.5赛季的美股真金白银实盘中,Grok 4.20完胜GPT-5.1和Gemini 3.0 Pro等一众顶流模型,在对手全线亏损的情况下,独自斩获了12.11%的正收益。成功背后的秘密是Grok对X的推文反映的市场情绪的及时精准捕捉。

来自主题: AI资讯
7202 点击    2025-12-08 10:30
36个月大逆转!他带着谷歌AI杀回来了,下一步世界模型

36个月大逆转!他带着谷歌AI杀回来了,下一步世界模型

36个月大逆转!他带着谷歌AI杀回来了,下一步世界模型

ChatGPT发布距今已近36个月,面对OpenAI的领先,哈萨比斯带领谷歌AI全面反攻,通过新发布的Gemini 3强势回归。Gemini 3在LM Arena等多个模型榜单登顶,表现优于GPT-5及其他模型,上演了一场完美逆袭。

来自主题: AI资讯
7034 点击    2025-11-24 10:18
马斯克Grok 4.1双冠封王,爆冲第一!AI王座一夜易主

马斯克Grok 4.1双冠封王,爆冲第一!AI王座一夜易主

马斯克Grok 4.1双冠封王,爆冲第一!AI王座一夜易主

AI新王来了!马斯克Grok 4.1静默上线,一夜之间登顶LMArena,Gemini 2.5 Pro却被按在地上摩擦。主打情商智商在线,算力又扩增一个数量级。这一次,Grok 4.1一共放出了两大版本:Grok 4.1 Thinking和Grok 4.1。

来自主题: AI资讯
8335 点击    2025-11-18 11:24