AI资讯新闻榜单内容搜索-ARC-AGI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ARC-AGI
Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

当地时间 2 月 19 日,Google 曝光 Gemini 3.1 Pro 最新模型。在 ARC-AGI-2 这个公认的推理基准测试中,Gemini 3.1 Pro 拿到了 77.1% 的分数。什么概念?它的前辈 Gemini 3 Pro 只有 31.1%,就连专门用来「深度思考」的 Gemini 3 Deep Think 也只有 45.1%。

来自主题: AI资讯
8596 点击    2026-02-20 13:53
刚刚谷歌发布 Gemini 3.1 Pro

刚刚谷歌发布 Gemini 3.1 Pro

刚刚谷歌发布 Gemini 3.1 Pro

今天凌晨,Google 发布 Gemini 3.1 Pro。核心提升在推理能力,ARC-AGI-2(抽象推理基准)从 3 Pro 的 31.1% 跳到 77.1%,翻了一倍多,GPQA Diamond(科学知识推理)从 91.9% 提到 94.3%

来自主题: AI资讯
10389 点击    2026-02-20 02:47
Loop-ViT:让AI学会「反复思考」,3.8M参数小模型追平人类平均水平

Loop-ViT:让AI学会「反复思考」,3.8M参数小模型追平人类平均水平

Loop-ViT:让AI学会「反复思考」,3.8M参数小模型追平人类平均水平

当我们解一道复杂的数学题或观察一幅抽象图案时,大脑往往需要反复思考、逐步推演。然而,当前主流的深度学习模型却走的是「一次通过」的路线——输入数据,经过固定层数的网络,直接输出答案。

来自主题: AI技术研报
9800 点击    2026-02-13 11:08
GPT-5.2考赢人类!OpenAI警告:大模型能力已过剩,AGI天花板不是AI

GPT-5.2考赢人类!OpenAI警告:大模型能力已过剩,AGI天花板不是AI

GPT-5.2考赢人类!OpenAI警告:大模型能力已过剩,AGI天花板不是AI

刚刚,GPT-5.2刷新了一项新纪录!OpenAI联合创始人Greg Brockman发帖称使用GPT-5.2在ARC-AGI-2基准测试上,表现超过了人类基线水平。

来自主题: AI资讯
10427 点击    2026-01-11 10:10
6位前DeepMind老将打造「AI指挥官」,一半成本刷新SOTA

6位前DeepMind老将打造「AI指挥官」,一半成本刷新SOTA

6位前DeepMind老将打造「AI指挥官」,一半成本刷新SOTA

6位前DeepMind成员以元系统重塑大模型调用方式,该系统推出的Gemini 3 Pro优化技术在ARC-AGI-2上以54%的成绩夺得榜首,而成本仅为此前最优方法的一半。

来自主题: AI技术研报
8368 点击    2025-12-15 11:31
全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

AI界「智商大考」ARC-AGI-2重磅出炉了!一个人类用5分钟轻松解开的谜题,却让最顶尖LLM全线崩盘得分挂零,o3更是从曾经76%暴跌至4%。它正式宣告,人类还未实现AGI。

来自主题: AI技术研报
8864 点击    2025-03-25 17:53