AI资讯新闻榜单内容搜索-Math

老师讲 12 小时，不如 AI 教 2 小时？这所高中直接干掉了所有老师，Claude、ChatGPT 也成学生日常

在近日的一场播客中，曾做出 5 款产品的 AI 创业公司 Every 创始人兼 CEO Dan Shipper 采访了一位特别的年轻人 Alex Mathew。这个来自美国得克萨斯州奥斯汀 Alpha 高中的 17 岁高三学生，同时也是一名 AI 硬件创业者。

来自主题: AI资讯

9646 点击 2026-03-02 10:16

GPT-5被吐槽没进步？Epoch年终报告打脸：AI在飞速狂飙，ASI更近了！

Epoch AI年终大盘点来了！出乎意料的是，AI没有停滞，反而变快了。

来自主题: AI技术研报

8363 点击 2025-12-25 10:49

30年数学难题，AI数学家Aristotle仅6小时告破！陶哲轩：ChatGPT们都失败了

昨晚，数学界炸了！由HarmonicMath开发的AI数学家「亚里士多德」（Aristotle），100%独立完成了埃尔德什问题#124。它在Lean证明系统中，耗时仅6个小时，验证只需1分钟。

来自主题: AI资讯

10453 点击 2025-12-01 12:41

GPT-5危了！DeepSeek开源世界首个奥数金牌AI，正面硬刚谷歌

沉寂许久的DeepSeek又回来了！今天，DeepSeekMath-V2重磅登场，一举夺下IMO 2025金牌，实力媲美甚至超越了谷歌的IMO金牌模型，开源AI再次扳回一局。

来自主题: AI资讯

10479 点击 2025-11-28 10:45

DeepSeek强势回归，开源IMO金牌级数学模型

就在刚刚，DeepSeek 又悄咪咪在 Hugging Face 上传了一个新模型：DeepSeek-Math-V2。顾名思义，这是一个数学方面的模型。它的上一个版本 ——DeepSeek-Math-7b 还是一年多以前发的。当时，这个模型只用 7B 参数量，就达到了 GPT-4 和 Gemini-Ultra 性能相当的水平。相关论文还首次引入了 GRPO，显著提升了数学推理能力。

来自主题: AI资讯

9945 点击 2025-11-27 22:47

R-HORIZON：长程推理时代来临，复旦NLP&美团LongCat重磅发布LRMs能力边界探测新范式

当前的训练与评测范式存在一个根本性的局限：几乎所有主流 Benchmark（如 MATH500、AIME）都聚焦于孤立的单步问题，问题之间相互独立，模型只需「回答一个问题，然后结束」。但真实世界的推理场景往往截然不同：为填补这一空白，复旦大学与美团 LongCat Team 联合推出 R-HORIZON—— 首个系统性评估与增强 LRMs 长链推理能力的方法与基准。

来自主题: AI技术研报

8751 点击 2025-10-23 16:22

一杯咖啡，3亿美金！斯坦福天才少女退学创业，Meta AI大牛排队加入

一次咖啡馆中的谈话，诞生了一家估值3亿美元的创业公司！2024年，仍为斯坦福大学博士生的Carina Hong与前Meta的AI研究员Shubho Sengupta有过一次数小时的交谈。在那次交谈中二人探讨了如何用AI来解决数学领域的难题。

来自主题: AI资讯

10057 点击 2025-10-03 00:01

研究人员打造带有AI同行评审的预印本平台，有望革新现有科学出版方式

在讨论 AGI 或者通用机器人定义时，人们往往会自然联想到一些直观的衡量标准，比如 AI 能否解出高考题、在国际数学奥林匹克（IMO，International Mathematical Olympiad）上获得金牌，或者机器人能否胜任家务。

来自主题: AI技术研报

8418 点击 2025-09-15 10:26

啥？陶哲轩18个月没搞定的数学挑战，被这个“AI高斯”三周完成了

不得了，这个名叫Gauss（高斯）的新AI Agent，有点杀疯了的感觉。因为它只用了三周的时间，就完成了陶哲轩和Alex Kontorovich提出的数学挑战——在Lean中形式化强素数定理（Prime Number Theorem，PNT）。

来自主题: AI资讯

11047 点击 2025-09-14 13:30

We-Math 2.0：全新多模态数学推理数据集 × 首个综合数学知识体系

近期，多模态大模型在图像问答与视觉理解等任务中进展迅速。随着 Vision-R1 、MM-Eureka 等工作将强化学习引入多模态推理，数学推理也得到了一定提升。

来自主题: AI技术研报

10183 点击 2025-08-28 12:20