突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙
8774点击    2025-05-15 19:58

谷歌DeepMind重磅推出AlphaEvolve,最强通用AI智能体横扫数学难题!它不仅推动了300年「接吻数难题」,一举颠覆了56年前Strassen算法神话。而且,还在AI训推、TPU设计、数据中心领域,展现出了极强的实力。


就在刚刚,谷歌DeepMind祭出终极AI智能体——AlphaEvolve,一个由Gemini驱动的进化编码神器。


历时一年半,它的出世,直接炸翻了算法界。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙


AlphaEvolve核心机制,是将谷歌Gemini解决创造性问题的能力和能验证答案的自动评估器相结合,然后用进化框架来优化最有潜力的想法。


它用48次标量乘法,搞定4x4复数矩阵乘法,改进了1969年Strassen最优算法。


AlphaEvolve不仅仅是矩阵乘法屠龙刀,还是个跨界狂魔。


DeepMind团队让其解决数学分析、几何、组合学、数论等领域的50+开放问题。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

菲尔兹奖得主陶哲轩等大佬亲自出题,谷歌论文致谢


在约75%题目中,它重新发现了最前沿解法;在20%题目中,它直接碾压了已知最佳解。


AlphaEvolve最炸裂的战绩,便是改进了困扰数学家300多年的「接吻数问题」!


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

Wikipedia已更新至谷歌DeepMind的最新数据


甚至,AlphaEvolve让谷歌数据中心效率飙升,平均回收了0.7%的计算资源。


此外,它还能提升芯片设计和AI训练过程的效率,包括训练它自己所使用的LLM。


AI初创创始人Justin Halford惊叹AlphaEvolve超人编码能力,并称编程将其十年内迎来AlphaGo时刻。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙


利用LLM设计更好的算法


2023年,谷歌首次展示了LLM的惊人能力:生成用计算机代码编写的函数,不仅能帮助发现开放科学问题的新知识,还能证明其正确性。


这一突破,为算法设计开启了全新篇章。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

论文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf


如今,谷歌AlphaEvolve更进一步,超越了单个函数的生成,进化出能够优化整个代码库,并开发更复杂算法的能力。


AlphaEvolve通过利用谷歌一系列SOTA模型,协同生成计算机程序,以代码形式实现高效的算法解决方案。


其中,最快、最高效的Gemini Flash最大程度地拓展了探索性思路的范围,而性能最强的Gemini Pro则通过富有洞察力提供关键优化建议。


AlphaEvolve的核心在于,其智能的算法生成与进化机制,如下图所示。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

提示词采样器为语言模型构建提示词,随后语言模型会生成新的程序。生成的程序会经过评估模块的评估并存储于程序数据库中,该数据库采用进化算法来决定哪些程序会被用于后续的提示词构建


AlphaEvolve还引入了自动评估指标,来验证、运行和评估候选程序。


它对提供的每个解决方案的准确性和质量,进行客观、可量化的评估。


这种系统化方法确保了算法优化透明度,尤其在数学、计算机科学等需要精确衡量进展的领域,展现出巨大的潜力。


发现矩阵乘法算法

颠覆56年最优解神话


AlphaEvolve的威力究竟有多炸裂?


它能为复杂的数学问题提出新方法。


在提供最小代码框架后,它便能设计出全新的基于梯度优化程序的组件发现了多种用于矩阵乘法的新算法。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙


AlphaEvolve开发的多种算法,在14个不同矩阵乘法任务上实现了技术突破。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙


其中,最耀眼的成果,是用48次标量乘法来完成4x4复数矩阵乘法,彻底颠覆了Strassen算法的「最优解」神话。


过去56年间,在特征为0的任意数域中,设计少于49次乘法的算法,始终是悬而未决的难题。


在求解过程中,AlphaEvolve对初始程序进行了重大改进,通过多项原创性设计逐步优化算法。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

Strassen算法


不仅如此,相较于前辈AlphaTensor,AlphaEvolve简直开了挂。


前者还在二进制算术下,对4x4矩阵做小修小补,后者直接杀入复数矩阵,效率飙升。


300年亲吻数难题再获突破


为了测试AlphaEvolve的极限,谷歌DeepMind还将其投入了数学分析、几何、组合学和数论中的50多个开放问题。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙


在短短几小时内,AlphaEvolve完成了大多数问题的设置,展现出惊艳的灵活性。


更令人震撼的是,它在大约75%情况下,重新发现了最先进的解决方案;在20%情况下,改进了已知的最佳解决方案,并在相应的开放问题上取得了进展。


以困扰数学家300多年「亲吻数」难题为例,AlphaEvolve在11维空间中,发现了593个外球的配置,刷新了该问题的下限。


这一突破不仅让几何界为之沸腾,更呈现了AlphaEvolve在高维数学空间无敌探索力。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

几何学中,数学空间的亲吻数被定义为一种空间排布下非重叠单位球体的最大数量。其中,所有的单位球体都与一个中心单位球体相切


此外,在这三个不同领域,AlphaEvolve取得的其他成果:


分析学领域


· 自相关不等式:AlphaEvolve在多个自相关不等式问题上,改进了已知最优界值。


有网友表示,陶哲轩还曾尝试开发一个AI,来验证分析中的估计,而且自己几年前曾梦想过的事情,正在变为现实。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙


· 不确定性原理:AlphaEvolve通过优化傅里叶分析中不确定性原理构造,生成了一种改进的配置,略微提高了上界。


组合数学与数论


· Erdős最小重叠问题:AlphaEvolve为最小重叠问题建立了新的上界,小幅超越了此前记录


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙


几何与堆积


· 亲吻数问题


· 堆积问题:AlphaEvolve在多个问题上取得突破:在给定形状内布置N个点,优化最大与最小距离比;实现多边形最优嵌套填充;改进Heilbronn问题变体(构造避免形成小面积三角形的点集)


重构计算生态系统

效率成倍飙升


当然,AlphaEvolve的突破不局限于数学,其实际应用已深刻改变了谷歌的计算生态系统。


在过去一年中,谷歌将AlphaEvolve发现的算法,部署到数据中心、硬件、软件等多个领域。


这些算法优化措施,显著提升了计算效率,尤其在AI和计算基础设施中成倍放大。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

AlphaEvolve助力谷歌实现了更高效的数字生态系统,涵盖从数据中心调度、硬件设计到AI模型训练的各个环节


这些改进不仅降低了能耗和运营成本,还为所有用户构建一个更强大、更可持续的数字生态系统。


数据中心调度 :节省0.7%计算资源


在优化谷歌庞大的数据中心调度系统Borg时,AlphaEvolve发现了一种简单但非常有效的启发式方法,显著提升计算资源效率。


这个解决方案已投入生产一年多,平均持续回收谷歌全球0.7%的计算资源。


这意味着,在相同的计算资源消耗下,任何时刻数据中心都能完成更多的任务。


更令人叹服的是,AlphaEvolve的解决方案不仅性能强大,其代码还具备显著的运营优势:可解释性、易调试性、可预测性和易部署性。


设计谷歌下一代TPU


AlphaEvolve的触角还延伸到了硬件设计领域。


在优化谷歌下一代TPU时,它提出了一种Verilog重写方案,精准删除了用于矩阵乘法的关键、高度优化的算术电路中冗余位。


至关重要的是,这个方案必须通过了严格的验证流程,确保了修改后的电路保持功能正确性。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

网友表示,这一改进代表了Gemini对TPU算术电路的首次直接贡献


目前,它已经被集成到了谷歌即将推出的TPU中。


通过在芯片设计师的标准语言中提出修改建议,AlphaEvolve架起了AI和硬件工程师之间桥梁,加速未来专用芯片的设计。


内核加速23%,优化时间缩短至数天


AlphaEvolve在AI训练和推理方面的突破,更是令人瞠目结舌。


通过找到更优的方法,将大型矩阵乘法分解为更易于处理的子问题,AlphaEvolve将Gemini架构中关键内核加速了23%,让训练时间缩短了1%。


在AI模型动辄消耗海量计算的今天,这一效率提升将节省巨大成本和能源消耗。


不仅如此,AlphaEvolve还将内核优化的工程时间,从专家数周砍到了自动实验的几天时间,大幅加速研究人员创新步伐。


AlphaEvolve还可以优化底层GPU指令。


这个极其复杂的领域通常已经通过编译器进行了大量优化,因此,人工优化往往难以奏效。


AlphaEvolve在基于Transformer的AI模型中,对FlashAttention内核实现高达32.5%的加速。


这种优化有助于专家查明性能瓶颈,并轻松地将改进纳入其代码库中,从而提高他们的生产力,并为未来节省计算资源和能源提供可能。


参考资料:

https://www.nature.com/articles/d41586-025-01523-zhttps://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/


文章来自于“新智元”,作者“桃子 好困”。


突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

关键词: AI , AI新闻 , AlphaEvolve , DeepMind
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0