AI资讯新闻榜单内容搜索-STP

谷歌AI攻克6道世界级难题，比IMO金牌更震撼！陶哲轩指明新玩法

Google DeepMind最新AI智能体Aletheia在FirstProof挑战赛中，独立攻克了6道世界级数学难题，实现了从竞赛水平到PhD科研级的质变。人类数学研究的「手工时代」或许正步入倒计时。

来自主题: AI资讯

9363 点击 2026-03-01 11:28

基于Gemini 3 Deep Think的谷歌数学智能体Aletheia在更难的挑战赛FirstProof中拿下的最佳成绩。在公布的完整成绩单中，10道题Aletheia全程0人工参与解出6道，其中5题专家全票通过，还有一题拿到了5/7的通过率。

来自主题: AI资讯

9314 点击 2026-02-27 11:09

STP（自博弈定理证明器）让模型扮演「猜想者」和「证明者」，互相提供训练信号，在有限的数据下实现了无限自我改进，在Lean和Isabelle验证器上的表现显著优于现有方法，证明成功率翻倍，并在多个基准测试中达到最先进的性能。

来自主题: AI技术研报

5186 点击 2025-02-28 15:21

部署 DeepSeek 系列模型，尤其是推理模型 DeepSeek-R1，已经成为一股不可忽视的潮流。

来自主题: AI资讯

8187 点击 2025-02-26 14:22