AI资讯新闻榜单内容搜索-Arc

GPT-5.2考赢人类！OpenAI警告：大模型能力已过剩，AGI天花板不是AI

刚刚，GPT-5.2刷新了一项新纪录！OpenAI联合创始人Greg Brockman发帖称使用GPT-5.2在ARC-AGI-2基准测试上，表现超过了人类基线水平。

来自主题: AI资讯

9899 点击 2026-01-11 10:10

信息论证明，小模型跑在本地才是Agent的终极解法｜斯坦福重磅

在近一年里，Agentic System（代理系统/智能体系统）正变得无处不在。从Open AI的Deep Research到Claude Code，我们看到越来越多的系统不再依赖单一模型，而是通过多模型协作来完成复杂的长窗口任务。

来自主题: AI技术研报

8498 点击 2026-01-04 10:20

0.002美元撬动顶级研究力，开源AI助手匹敌OpenAI商用系统

近日，美国华盛顿大学博士生邵如琳和合作团队打造出一个名为 Deep Research Tulu（DR Tulu）的深度研究小助手。使用一次 OpenAI 的 Deep Research 服务可能需要大约 1.8 美元，而 DR Tulu 使用一次的成本却不到 0.002 美元，这几乎是千倍的效率提升，这意味着未来个人或者小团队也能负担得起高质量、高可信度的 AI 研究服务。

来自主题: AI资讯

7802 点击 2026-01-02 15:04

系统学习Deep Research，这一篇综述就够了

近年来，大模型的应用正从对话与创意写作，走向更加开放、复杂的研究型问题。尽管以检索增强生成（RAG）为代表的方法缓解了知识获取瓶颈，但其静态的 “一次检索 + 一次生成” 范式，难以支撑多步推理与长期

来自主题: AI技术研报

7232 点击 2026-01-02 15:01

奥特曼摊牌：别再比模型跑分了，苹果才是真宿敌

别被 2025 年的模型乱战骗了！这可能是一个巨大的误判。 LifeArchitect在上帝视角复盘：当下的喧嚣不过是爆发前的「基建期」。到2026年，从6T规模的Grok-5到消失在后台的GPT-6，全行业正迎来一场蓄谋已久的「集体解锁」。真正的换代不再是变聪明，而是像iPhone焊死iOS那样，让AI彻底成为文明的基础设施。

来自主题: AI资讯

9603 点击 2025-12-29 09:04

比 Gemini 更严谨，比 GPT 更靠谱：谷歌这个隐藏功能，太强了！

今天，我想以一个 AI 实战派的身份，再次向大家推荐我目前心中“信息核查”的 No.1 工具——Google 搜索 AI 模式（Google Search AI Mode）。为什么是它？Gemini / ChatGPT 们做不到吗？

来自主题: AI资讯

8552 点击 2025-12-27 22:15

超越GPT-5、Gemini Deep Research！人大高瓴AI金融分析师，查数据、画图表、写研报样样精通

能自动查数据、写分析、画专业金融图表的AI金融分析师来了！最近，中国人民大学高瓴人工智能学院提出了一个面向真实金融投研场景的多模态研报生成系统——玉兰·融观（Yulan-FinSight）。

来自主题: AI资讯

8233 点击 2025-12-26 15:46

无需再训练微调，一个辅助系统让GPT-5.2准确率飙到创纪录的75%

什么？决定 AI 上限的已不再是底座模型，而是外围的「推理编排」（Orchestration）。

来自主题: AI资讯

7341 点击 2025-12-25 14:19

ImageNet分数越高，生成反而越糊？iREPA给出解释

学霸的谎言被揭穿！一篇来自Adobe Research的论文发现，高语义理解并不会提升生成质量，反而可能破坏空间结构。用iREPA简单修改，削弱全局干扰，生成质量立即飙升。

来自主题: AI技术研报

9063 点击 2025-12-23 10:05

陈天桥旗下盛大AI东京研究院于SIGGRAPH Asia正式亮相，揭晓数字人和世界模型成果

在 SIGGRAPH Asia 2025 期间，盛大 AI 东京研究院（Shanda AI Research Tokyo）以展台活动、BoF 学术讨论与顶尖教授闭门交流等形式完成首次公开亮相，标志着盛大在数字人的 “交互智能 (Interactive Intelligence)” 与世界模型的 “时空智能 (Spatiotemporal Intelligence)” 等两大方向的研究

来自主题: AI资讯

8336 点击 2025-12-22 12:50