地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警
7706点击    2025-11-06 11:05

地理AI,还得看谷歌!


谷歌首次实现地球尺度的复杂地理空间推理,把地球变成「可计算对象」。


基于数十年在世界建模上的经验,结合Gemini的先进推理能力,谷歌重磅升级Earth AI——


从环境监测到灾害响应,尽在其中。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


谷歌地球AI「Google Earth AI」是一系列地理空间AI模型和数据集,其中包括由Gemini驱动的地理空间推理模型,可自动连接不同的地球AI模型——天气预报、人口地图和卫星图像——并回答不同的问题。


此前,谷歌在Gemini API中上线了谷歌地图工具。


谷歌地球开外挂, 不止Gemini当导游


单个AI能力日益强大,但现实世界的问题常常需要融合跨领域知识。


台风可能在哪里登陆?哪些社区最不安全?应如何防台风?


要回答这类问题,需统筹处理影像、人口与环境数据,综合推理。


今年,谷歌推出的地球AI因此而生。


但这次,结合强大的基础模型与Gemini的空间推理智能体,谷歌首次实现了「地球尺度」的复杂现实问题推理能力。


基于真实世界数据,基础模型提供对地球的深度认知


而智能体则扮演智慧指挥者角色:将复杂问题拆解为多步骤方案,通过调用基础模型、查询海量数据库、运用地理空间工具执行计划,最终融合各阶段成果形成整体解决方案。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


今日,谷歌重磅推出Earth AI全新创新成果:


  • 发布新一代影像与人口基础模型,并公布技术细节和评估报告


  • 提出空间推理智能体


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


研究表明,借助地理空间推理,分析人员不再仅能预测风暴路径,更能一次性锁定最脆弱的社区与高危基础设施。


例如,非营利组织GiveDirectly通过融合洪水数据与人口密度信息,精准定位急需援助的受灾群体,提升救灾效率。

地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


谷歌表示,自去年开始试点的集成对话功能,可帮助用户在卫星影像中发现目标与规律。例如,用户只需输入「查找藻华」,即可让谷歌地球监控饮用水源状况。


这项研究令人振奋之处在于它正在推动的重要AI落地应用:


波士顿儿童医院开展的精准社区健康干预,


GiveDirectly在灾害中快速定位最需援助的群体,


世界卫生组织非洲区预测霍乱暴发风险区的行动


空中客车通过检测植被侵占输电线路帮助客户预防停电,


以及芝加哥大学运用模型预测印度季风季来临,并与印度农业与农民福利部合作,向3800万农民发送精准预报。


谷歌也有实用的AI落地功能——


2025年加州山火期间,谷歌向洛杉矶地区1500万人推送了危机警报,并在地图中实时显示可前往的避难所位置。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


这些成果背后,正是谷歌在地理空间AI领域的深厚积累——其模型不仅用于洪水与山火预警,也涵盖气旋、空气质量等众多场景。


谷歌首次实现地球尺度的推理


在最新发布的技术论文中,谷歌首次公开「遥感基础模型」与「人口动力学基础模型,并展示了地理空间推理智能体的强大能力:


🌍 智能地理推理:基于Gemini的智能体,可协调多维度Earth AI模型,解答复杂跨模态问题。


🌍 深度洞察升级:谷歌地球集成Earth AI模型+Gemini功能,支持用户通过自然语言在卫星影像中智能检索目标


🌍 云端开放接入:通过Google Cloud平台,向可信测试者直接开放Earth AI核心模型(影像/人口/环境)


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


传送门:https://arxiv.org/abs/2510.18318


Earth AI建立在多源、多模态的地理空间数据与工具基础上(下图左侧)。


之后,影像、人口与环境三大垂类领域子智能体与模型处理这些数据(下图中部)。


最终由Earth AI地理空间推理智能体(下图右侧)进行全局整合,从而实现全方位的地理空间分析与洞察生成。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


三大基础模型:影像、人口、环境


遥感基础模型简化了三大核心能力, 加速了卫星影像分析。


首先,合成标注+网络获取的数据,构成了核心组件训练数据集。


训练好的视觉语言模型与开放词汇检测模型,可直接应用于分类、检测与检索任务;通过微调,视觉Transformer编码器则可提升下游特定任务的表现。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


遥感基础模型的训练与应用流程,核心为视觉语言模型、开放词汇对象检测模型、预训练ViT编码器


用户可使用自然语言提出查询,即可获得快速精准的响应,如「找出暴雨后图像中被淹没的道路」。


基于海量高分辨率航拍影像与文本描述联合训练,在多项公开地球观测基准测试中,遥感基础模型取得突破性表现——


基于文本的图像检索任务平均提升超16%,而针对新类别物体的零样本检测精度,更达到基准线的两倍以上。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


要深入理解人类活动与地理环境之间复杂的互动关系,需要研究涵盖「移动性AI」(Mobility AI)与「人口动力学基础模型」(Population Dynamics Foundations)等领域。


在这次研究中,人口动力学基础模型引入了两项关键创新:


1、覆盖17个国家的全球统一嵌入表示(embeddings);


2、按月更新的人类活动动态嵌入


这些新特性对于时间敏感型预测尤为重要,因为它们能更精准地捕捉人类行为的变化节奏。


训练分为两阶段——


第一阶段为离线训练:通过整合多元地理空间数据(地图数据、搜索趋势、人流活跃度及环境条件),生成紧凑的区域嵌入表征


第二阶段利用预训练嵌入,针对细分下游任务进行动态微调,实现局部统计数据的空间插值、外推、超分辨率重建及趋势预测等功能。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


人口动力学基础模型双阶段框架


谷歌内部在17个国家的数据上评估了「人口动力学基础模型」,结果显示:在预测人口密度、树木覆盖率、夜间灯光强度和海拔高度四项指标时,各国R²评分(取值范围0-1,数值越高越好)均表现优异。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


按美国邮政编码,谷歌可视化了人口动力学基础嵌入向量的各维度相似度。不同维度上的模式反映了美国人口的多样特征。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


独立研究结果也验证了这一模型的强大性能。


比如,牛津大学的研究人员在预测巴西登革热传播时引入了该模型提供的嵌入表示,显著提升了长期预测的准确性——12个月的 R² 值(衡量模型对实际发病率解释程度的指标)从0.456提升至0.656。


之前,谷歌已实现中程天气预报、季风爆发预测、空气质量监测及河流洪水预警等领域的技术突破。


近期,更将环境模型升级至支持全球范围降水临近预报,并将重大河流洪水预警覆盖范围扩展至20亿人口


地理空间推理智能体:解锁地球潜力


解决现实世界问题,需要融合多种专业模型的洞察。


地理空间AI的未来,不在于各自为政的单一模型,而在于由高级AI协调的、集成化的多模态生态系统。、


谷歌全新推出的Gemini驱动地理空间推理智能体,能够智能协调这些Earth AI的不同能力。


研究证实:多模型融合,预测能力更强。


Earth AI的终极目标是帮助用户解答需要跨模型、跨数据源多维推理的复杂现实问题。


此类查询可按复杂度分为三个层级:


  1. 描述与检索型询:事实查找,如「2020年8月,纽约最高气温记录是多少?」
  2. 分析与关联型查询:揭示不同数据源间的模式关联,如「卡特里娜飓风登陆时,路易斯安那州有多少医院位于遭受严重风暴影响的区域?」
  3. 预测或推断型查询:信


为了解决三大复杂度类别的查询,谷歌专门设计了「地理空间推理智能体」。


为了迭代优化响应, 智能体不断重复「思考与规划→数据操作/模型推理/训练→反思与修正」循环,直至生成基于可靠依据的最终答案。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


地理空间推理智能体运行框架


比如,当用户需要识别受风暴威胁的特定脆弱人群时,智能体通过以下透明化推理步骤实现精准分析:


  1. 环境风险建模:调用环境模型,精准划定受飓风级风力威胁的地理区域范围
  2. 人口密度分析:查询Data Commons人口统计库,识别预测登陆区内的高人口密度县市
  3. 行政边界匹配:从BigQuery公共数据集获取目标县市的官方行政边界数据
  4. 空间叠加计算:对风力影响区域与行政边界,进行几何空间交集运算
  5. 脆弱区域定位:基于人口动态基础模型与县级统计数据实时训练机器学习模型,精准定位最脆弱的邮政编码区域
  6. 关键设施识别:运用遥感基础模型的目标检测能力,在最脆弱区域的卫星影像中,自动识别医院、避难所等关键基础设施


这种分层推理机制将原始数据转化为应对灾害的决策知识,体现了多模态AI在应急管理领域的突破性应用。


为评估智能体性能,谷歌开发了两种创新评估方法:基于公开数据构建的问答基准测试(含可验证真实答案),以及面向复杂预测场景的危机响应案例研究。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


Earth AI智能体将天气模型、人口数据与地理空间分析有机结合,实现自动化的灾害风险识别与可视化推理。


在问答基准测试中,地理空间推理智能体取得了0.82的综合准确率,显著优于Gemini 2.5 Pro(0.50)和Gemini 2.5 Flash(0.39)基线智能体。


这一结果印证了为智能体配备专业地理空间模型与工具对处理此类查询的关键价值。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


创新永无止境


过去两周,从基因组学到量子计算乃至地理空间认知领域,谷歌研究院取得了一系列新成果。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


这些突破完美印证了谷歌研究负责人Yossi Matias所提出的「魔法循环」研究模式:通过基础研究应对全球性挑战与机遇,并直接转化为现实应用方案。


这些方案不仅惠及全球数亿民众,更不断揭示出待探索的新课题。


研究是人类改善日常生活、应对社会挑战、把握时代机遇的必经之路,这也意味着科研与创新永无止境。


地球级AI智能体爆诞!谷歌地球开外挂,一夜为20亿人洪水预警


在更强的模型与智能工具驱动下,魔法循环正在加速运转,产生跨学科领域的连锁反应。


参考资料:


https://blog.google/technology/research/new-updates-and-more-access-to-google-earth-ai/


https://research.google/blog/google-earth-ai-unlocking-geospatial-insights-with-foundation-models-and-cross-modal-reasoning/


https://www.linkedin.com/feed/update/urn:li:activity:7387289443260436480/


https://arxiv.org/abs/2510.18318%20https://ai.google/earth-ai



文章来自于微信公众号 “新智元”,作者 “新智元”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

5
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner