AI资讯新闻榜单内容搜索-Math

AI Agent搞定世纪首次菲尔兹奖成果形式化！一周时间独立完成，20万行代码已公开

5天时间，AI就搞定了原本需要6个月完成的菲尔兹奖级数学成果的形式化证明。

来自主题: AI资讯

7154 点击 2026-03-04 11:24

老师讲 12 小时，不如 AI 教 2 小时？这所高中直接干掉了所有老师，Claude、ChatGPT 也成学生日常

在近日的一场播客中，曾做出 5 款产品的 AI 创业公司 Every 创始人兼 CEO Dan Shipper 采访了一位特别的年轻人 Alex Mathew。这个来自美国得克萨斯州奥斯汀 Alpha 高中的 17 岁高三学生，同时也是一名 AI 硬件创业者。

来自主题: AI资讯

8080 点击 2026-03-02 10:16

GPT-5被吐槽没进步？Epoch年终报告打脸：AI在飞速狂飙，ASI更近了！

Epoch AI年终大盘点来了！出乎意料的是，AI没有停滞，反而变快了。

来自主题: AI技术研报

7290 点击 2025-12-25 10:49

30年数学难题，AI数学家Aristotle仅6小时告破！陶哲轩：ChatGPT们都失败了

昨晚，数学界炸了！由HarmonicMath开发的AI数学家「亚里士多德」（Aristotle），100%独立完成了埃尔德什问题#124。它在Lean证明系统中，耗时仅6个小时，验证只需1分钟。

来自主题: AI资讯

9281 点击 2025-12-01 12:41

GPT-5危了！DeepSeek开源世界首个奥数金牌AI，正面硬刚谷歌

沉寂许久的DeepSeek又回来了！今天，DeepSeekMath-V2重磅登场，一举夺下IMO 2025金牌，实力媲美甚至超越了谷歌的IMO金牌模型，开源AI再次扳回一局。

来自主题: AI资讯

9475 点击 2025-11-28 10:45

DeepSeek强势回归，开源IMO金牌级数学模型

就在刚刚，DeepSeek 又悄咪咪在 Hugging Face 上传了一个新模型：DeepSeek-Math-V2。顾名思义，这是一个数学方面的模型。它的上一个版本 ——DeepSeek-Math-7b 还是一年多以前发的。当时，这个模型只用 7B 参数量，就达到了 GPT-4 和 Gemini-Ultra 性能相当的水平。相关论文还首次引入了 GRPO，显著提升了数学推理能力。

来自主题: AI资讯

8829 点击 2025-11-27 22:47

R-HORIZON：长程推理时代来临，复旦NLP&美团LongCat重磅发布LRMs能力边界探测新范式

当前的训练与评测范式存在一个根本性的局限：几乎所有主流 Benchmark（如 MATH500、AIME）都聚焦于孤立的单步问题，问题之间相互独立，模型只需「回答一个问题，然后结束」。但真实世界的推理场景往往截然不同：为填补这一空白，复旦大学与美团 LongCat Team 联合推出 R-HORIZON—— 首个系统性评估与增强 LRMs 长链推理能力的方法与基准。

来自主题: AI技术研报

7591 点击 2025-10-23 16:22