地理学的AlphaEvolve？MIT斯坦福让AI自我生长、懂地理、懂世界

9165点击 2025-10-28 13:34

以下或许是一位地理科研工作者的日常：为了让所需的地理模型表现得更好，他不断和大模型（如ChatGPT）对话，尝试改进代码或修复bug。

大模型给出的初版答案往往并不完美，于是研究者又会根据结果提出新的修改意见。就这样一来一回，经过不断交互，代码逐渐被打磨得完善。

这种「和大模型互动、改进算法」的方式，已经成为地理研究的常见操作。

那问题来了：能不能更进一步？——让这种交互—改进的过程自动发生，让AI不再只是帮手，而是真正像科学家一样，自己去进化地理模型？

MIT和斯坦福学者提出了GeoEvolve，尝试了这样一种探索：

🌍把地理知识「嵌入」AI，让它的进化更靠谱、更接近地理学原理；

🤖让大模型不只是辅助工具，而是成为能够自主改进算法的「科研合作者」。

地理学的AlphaEvolve？MIT斯坦福让AI自我生长、懂地理、懂世界

传送门：https://arxiv.org/abs/2509.21593

项目地址：https://vezarachan.github.io/GeoEvolveWebPage/

GeoEvolve 已经开源为 Python 包，可直接安装使用（pip install geoevolve）。

研究背景

地理空间建模是理解气候变化、推动城市可持续发展的关键工具。

但传统方法往往依赖专家经验：提出假设、设计算法、不断调参改进。

近年来，大语言模型（LLMs）展现了自动进化代码的潜力。比如Google最新推出的AlphaEvolve，就能让AI自己尝试、变异、优化算法。

然而，这类系统有一个天然短板——它们并不懂地理。如果完全放任AI去进化，很容易「跑偏」，生成的模型缺乏地理学上的合理性。

正因如此，GeoEvolve的提出构建了一个结合AI自主进化与地理知识引导的新框架。

GeoEvolve框架

如图1所示，可以把GeoEvolve想象成一个「由导师和博士生组成的GeoAI研究团队」：

内循环：AI扮演博士生，基于初始代码，互相交流，不断试错、生成和改进算法；

外循环：一个「导师」——地理知识库（GeoKnowRAG）在旁提醒，确保演化方向符合空间理论。

GeoEvolve的四个核心模块分别是：

代码进化器(自动生成和变异候选算法)，

代码分析器(诊断问题、提出改进思路)，

地理知识检索器（GeoKnowRAG，提供空间学理论与经典方法），

知识驱动提示生成器(把复杂的地理知识转化为AI能理解的优化指令)。

通过这套双循环机制，GeoEvolve不仅能写代码，更能逐渐学会像地理学家一样思考。

整个GeoEvolve的输入，只有三样：

原始模型——需要改进的地理模型（甚至可以是一张「白纸」的空白模型）；

评价指标——衡量模型优劣的标准（比如RMSE、MAE）；

提示语——给大模型的一句话任务说明（例如：「请帮我改进这个Kriging模型」）。

地理学的AlphaEvolve？MIT斯坦福让AI自我生长、懂地理、懂世界

图1.GeoEvolve所依赖的基本思想，地理知识引导下的算法进化。虚线框表示通用的算法生成引擎(例如AlphaEvolve)。外部流程展示了本文提出的知识引导型算法生成方法，专门面向地理空间建模场景。

图2展示了GeoEvolve详细的框架。

GeoEvolve旨在通过结合进化式代码生成与结构化地理空间知识，实现地理空间模型的自动发现。

与通用的代码智能体不同，GeoEvolve融合了来自空间建模文献与经典算法的领域知识，从而能够探索并发现新的地理空间算法。

它由四个主要部分组成：(1)代码进化器，(2)演化代码分析器，(3)地理知识检索器，以及(4)知识驱动提示生成器。

这些组件共同构成了一个闭环的代码生成、评估与改进过程，从而推动地理空间模型的自动化发现。

地理学的AlphaEvolve？MIT斯坦福让AI自我生长、懂地理、懂世界

图2.GeoEvolve的框架

如图3所示，为了避免AI在进化过程中「跑偏」，GeoEvolve引入了一个专门的地理知识检索模块（GeoKnowRAG）。

它相当于一个「地理知识库」，收集了来自Wikipedia、arXiv和GitHub的核心资料，包括空间自相关、异质性、Kriging、地理加权回归等经典概念与算法。

系统会把这些知识转化为结构化数据库，并在AI进化时调用，通过智能检索与融合（RAG-Fusion），为代码生成提供有理论支撑的提示。

这样，AI就能在「懂地理」的前提下进行算法改进，确保进化出的模型既聪明又可靠。

地理学的AlphaEvolve？MIT斯坦福让AI自我生长、懂地理、懂世界

图3.GeoKnowRAG的框架

案例研究：对Kriging的自动化改进

Ordinary Kriging是地质统计学中最经典的空间插值方法，被广泛应用于环境监测、气候分析和资源勘探。

但它的核心算法提出已久，后续研究更多是「外挂式」的结合，比如与回归模型结合形成regression kriging，而对Kriging本身结构的改进几乎没有新的突破。

GeoEvolve得到的全新Kriging model

在实验中，GeoEvolve在保留Kriging核心的基础上，通过进化和知识引导自动注入了多项改进，仅选取几个为例展示：

1.自适应经验变差图估计

原始方法用固定分箱，容易受异常值影响。

GeoEvolve借鉴统计学方法，引入Silverman分箱规则、分位数分箱和截尾均值，自动确定合适的区间数量。

2.多起点全局拟合

传统拟合容易陷入局部最优。

GeoEvolve用多起点优化+L1或加权最小二乘，保证参数物理意义合理（如变程不为负）。

3.自适应数据变换

在数据偏态严重时，GeoEvolve会自动选择合适的对数变换+偏移量，保证残差分布更合理，预测更稳定。

上述改进如果单独来看，也许只是一些「渐进式增强」；但当它们被GeoEvolve自动组合、进化，并在真实实验中显著提升预测精度时，就展现出强大的效果。

地理学的AlphaEvolve？MIT斯坦福让AI自我生长、懂地理、懂世界

将GeoEvolve-Kriging与其他自动化算法发现的Kriging模型进行对比，选取澳大利亚某矿区的铜（Cu）、铅（Pb）、锌（Zn）预测作为实验场景。

如表格所示，结果差异十分明显：

地理学的AlphaEvolve？MIT斯坦福让AI自我生长、懂地理、懂世界

原始Kriging：表现最差，预测误差最高；

OpenEvolve-Kriging：在部分指标上有所改善，但在锌元素预测中反而退步；

加入地理知识提示的OpenEvolve：并没有带来额外提升，说明缺乏针对性的知识很难真正帮助算法演化；

GeoEvolve（无知识库版本）：已经显著优于OpenEvolve，但仍不及完整版本；

完整GeoEvolve-Kriging：始终表现最佳，在三种金属元素的预测中都取得了最低RMSE和MAE。

具体来说，GeoEvolve相比OpenEvolve-Kriging，RMSE分别降低了11.3%（Cu）、20.9%（Pb）、13.5%（Zn）；相较于原始Kriging，降低幅度更是达到15.4%、21.2%、13.0%。

这清楚地表明，结构化的地理知识库（GeoKnowRAG）在算法进化中起到了关键作用，让AI不仅能写出代码，更能在「懂地理」的前提下进化出更强的插值模型。

总结

GeoEvolve的实验结果告诉我们：AI不只是会修改代码，它还可以在地理学知识的引导下，自主进化出更强的经典模型。这意味着：

未来的地理建模，不一定总是研究人员「手工设计」，然后基于LLMs进行修改；
我们可以让算法开发过程完全自动化，让AI不断试错、吸收知识，最终学会像地理学家一样思考；
GeoEvolve展示了一条通向可信赖的GeoAI的新道路，也为AI-for-Science在地理科学和可持续发展中的应用打开了可能。
或许在不久的将来，AI将不仅是工具，更是科研合作者。

参考资料：

Luo，P.，Lou，X.，Zheng，Y.，Zheng，Z.andErmon，S.，2025.GeoEvolve: Automating Geospatial Model Discovery via Multi-Agent Large Language Models. arXiv preprint arXiv:2509.21593

文章来自于微信公众号 “新智元”，作者 “新智元”

关键词: AI新闻 , GeoEvolve , AI地理 , AI科研

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI