陶哲轩:千年数学规则被AI按下重启键

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
陶哲轩:千年数学规则被AI按下重启键
6457点击    2026-05-17 11:19

陶哲轩,公开演讲承认AI已彻底改变数学工作流。


周三,这位菲尔兹奖得主在斯坦福大学发表了一场题为《新数学工作流》的演讲。


陶哲轩:千年数学规则被AI按下重启键


然后在Mathstodon上写下一条公告:


他要改变自己的工作习惯,不再试图实时跟进所有新证明。


陶哲轩:千年数学规则被AI按下重启键


一个每年审阅上百篇论文的数学家,亲手给自己按下了暂停键。


原因不是他老了,不是他累了,而是一个他亲眼看着成形的事实:


AI生成数学证明的速度,已经远远超过人类消化证明的速度。


数学正在被AI撑爆。


证明,不再稀缺了


陶哲轩在演讲开头就甩出了一个判断:


数学正在经历其他科学领域早已经历过的那场革命。


生物学有基因测序爆炸、天文学有望远镜数据洪流,每个学科进入「数据丰裕」时代之后,都被迫重建自己的工作流程。


AI时代,数学的版本是:证明丰裕。


几千年来,数学一直活在「证明稀缺」的年代。


看一眼数学论文的署名传统就知道——其他学科早已习惯10人、20人、50人合著的常态,数学一百年来还卡在1-2人。


陶哲轩在演讲里直接放了一张对比图,那条几乎贴地的线就是数学。


陶哲轩:千年数学规则被AI按下重启键


为什么数学这么独?因为证明很贵


一篇定理的诞生需要几年甚至几十年——Andrew Wiles关了自己7年才证完费马大定理。


陶哲轩:千年数学规则被AI按下重启键


在那个稀缺时代,「谁第一个走出帐篷」就是最自然的衡量标准。


你给他一切——荣誉、教职、奖项、定理的署名权。


这套激励运转得非常好,因为它和「推动整个数学社区进步」的目标基本对齐:


第一个走出来的人,通常也是把这件事讲清楚的人。


一个猜想悬在那里几十年,全世界最聪明的脑袋轮番上阵,能解出来就是载入史册的事件。


整个学科的激励体系、荣誉体系、评价体系,全部建立在这个稀缺性之上。


现在稀缺性正在被AI抹掉。


陶哲轩举了一个很具体的例子。


Erdős问题网站——数学界最著名的未解难题清单之一,目前已经有大约20篇AI辅助解题方案处于积压待审状态。


提交者自己坦言:根本没有时间手动验证。


陶哲轩:千年数学规则被AI按下重启键


不是没人想看,是看不过来。


陶哲轩把这比作19世纪的汽车困境——车的速度越来越快,但当时的道路系统根本承载不了。


结果不是交通更快了,而是交通更堵了。


AI是能生成数学难题的证明。


陶哲轩:千年数学规则被AI按下重启键


但证明堆在那里没人消化,等于什么都没证明。


数学家的工作流,被AI切成了三段


陶哲轩在演讲里把数学的生产过程拆成三步。


第一步,proof generation,证明生成。


AI现在已经在批量产出。


GPT-5.5、Claude Opus 4.7、专门做形式化数学的求解器,一夜之间能涌出几十条新证明。一年前还是惊喜的事情,现在变成生产线日产。


第二步,verification,证明验证。


Lean、Coq这一类形式化验证工具大半年迭代一次。


AI加Lean让验证流程半自动化,审稿人不再需要一行一行手算每个引理。


GPT-5.2解Erdős#728那次,验证环节由工具Aristotle自动完成,陶哲轩本人只在终点确认了一下。


第三步,digestion,消化与理解。


现在,完全空白。


没有任何工具能帮数学家把机器证完的东西转化成人类读得懂的洞察。


一条证明被形式化验证为正确,和这条证明对数学家有用,是两回事。


前两阶段越快,第三阶段越追不上。


更要命的是,目前学术界没有任何成型的方法论,让数学家批量消化AI产出的证明。


每天审稿邮件里塞满Lean验证过的新证明,能读的人就那么多。


陶哲轩:千年数学规则被AI按下重启键


陶哲轩说了一句被现场反复引用的话:


数学的本质,不是积累正确证明的数量,是让人类理解这个世界为什么是这样运行的。


机器解出#1196是一回事。


陶哲轩亲自从Price的证明里提炼出向下冯·曼戈尔特链这种新概念、再把它扩展成新理论,是另一回事。


前者AI可以包圆。


后者目前还得人来做。


而且越来越没人做得过来。每天几十条新证明涌出来,能读懂的数学家就那么多。


瓶颈不在生产端,在阅读端。


技术正确,但没人理解


真正让陶哲轩警觉的,不是AI生成证明的速度,而是AI生成的证明长什么样。


他在演讲中做了一个关键区分:数学研究有两类目标。


第一类是显性目标——证明某个定理、解决某个猜想。写在论文标题里的那种。


第二类是隐性目标——弄清楚这个证明和已有文献的关系,发现后续的自然问题,提炼新的技术手段,理解核心困难在哪里,以及最重要的:让做这个研究的人本身变得更强。


过去几百年里,这两类目标从来不需要分开讨论。


因为当一个人类数学家解决一个问题时,隐性目标是自动完成的——你不可能在证明过程中不了解文献、不发现新问题、不训练自己的直觉。


AI把它们拆开了。


AI可以在技术层面解决显性目标,给出一个逻辑上正确的证明。但它生成的证明不引用已有文献,不突出核心思想,不启发后续研究,不帮任何人变得更聪明。


用陶哲轩的表述:这种证明技术上正确,但与数学的真正进步目标脱节。


一道题被AI解了,但数学界对这道题的理解没有增长一毫米。


这就像一个学生在考试里拿了满分,但走出考场什么都没学到。


古德哈特定律发作了


陶哲轩在演讲里搬出了一个经济学概念:古德哈特定律。


一个学术界耳熟能详的名字——Charles Goodhart,1975年提出那条以他名字命名的定律:


当一个衡量标准变成目标,它就不再是好的衡量标准。


陶哲轩:千年数学规则被AI按下重启键


这条定律过去50年发作过无数次:


  • KPI文化下的销售作假
  • Twitter算法把互动变成目标,结果催生了愤怒经济
  • 学术影响因子(h-index)被刷成了产业链


数学曾经是少数没被它击穿的领域。


当一个衡量标准变成目标时,它就不再是一个好的标准。


翻译到数学界:「谁第一个证明了这个定理」,曾经是衡量数学进步的好指标。


因为在证明稀缺的年代,能第一个证明的人,一定深入理解了问题,一定推进了数学的前沿。


显性目标和隐性目标完全对齐。


AI让这个对齐崩了。


第一个证明的速度可以被无限加速,但理解不能。


当整个社区开始无限制地卷「证明速度」,这个指标就和真正的数学进步脱钩了。


继续按旧规则玩,不仅不创造进步,反而在多方面阻碍数学的发展。


陶哲轩的建议很明确:停止对「谁是第一个解决某个未解难题」的过度执着。


把锦标赛式的极限优化引导到更受控的方向——比如专门为重度使用AI而设计的数学竞赛工作流,让竞速归竞速,让理解归理解。


菲尔兹奖得主亲手给数学界的旧游戏规则判了缓刑。


数学是预告片


把视线从数学拉远一步。


陶哲轩描述的这个困境——AI产出速度远超人类消化速度,显性目标和隐性目标被强行解耦——不是数学独有的。


代码可以被AI大量生成,但没人review。


论文可以被AI批量写出,但没人读。


诊断可以被AI秒出,但医生来不及理解推理过程。


每一个知识密集型行业,都在走向同一个岔路口:产出在爆炸,理解在停滞。


陶哲轩在演讲中反复强调一句话:数学不只是一堆互不相关的定理的集合,它上面有一整套系统。


证明是砖。但建筑不是砖堆。


当AI能无限供应砖块的时候,建筑师比砖匠更重要。


问题是,连建筑师都快被埋在砖堆下面了。


陶哲轩选择不追了。


陶哲轩:千年数学规则被AI按下重启键


不是追不上,而是他发现,追本身正在成为问题。


锦标赛灯光熄了,剧场刚刚开门


陶哲轩在演讲最后,留下一个具体的提议。


为AI重度使用设计专门的数学竞赛。


评判标准不再是「谁先证出来」,是谁的证明体系最有解释力、谁的形式化最干净、谁能推动整个领域消化某个突破。


陶哲轩:千年数学规则被AI按下重启键


这句话的潜台词很明白:奖项、期刊、招聘评价——所有建立在证明稀缺时代之上的制度,都要重做。


数学不是被AI终结的第一门学科。


但它是第一门由顶级专家亲手宣告规则失效的学科。


物理、化学、生物大概率会跟上。


千年来,数学家比谁先证出来。


从今天起,比的是谁更能读得懂AI的证明。


参考资料:


https://www.youtube.com/watch?v=Uc2zt198U_U


https://mathstodon.xyz/@tao/116569989993991669


文章来自于微信公众号 “新智元”,作者 “新智元”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费