36个月大逆转！他带着谷歌AI杀回来了，下一步世界模型

7995点击 2025-11-24 10:18

ChatGPT发布距今已近36个月，面对OpenAI的领先，哈萨比斯带领谷歌AI全面反攻，通过新发布的Gemini 3强势回归。Gemini 3在LM Arena等多个模型榜单登顶，表现优于GPT-5及其他模型，上演了一场完美逆袭。

大模型排行榜，你方唱罢我登场。

马斯克的Grok 4.1刚登顶，随后就被Gemini 3 Pro反超了，上演了一幕AI版的「速度与激情」！

谷歌DeepMind CEO哈萨比斯（Demis Hassabis）

哈萨比斯在X平台上兴奋地晒出Gemini 3的成绩单，称其「当然地」登顶各大排行榜，并表示这是自己迄今为止最爱的模型。

36个月大逆转！他带着谷歌AI杀回来了，下一步世界模型

就连奥特曼和马斯克，也纷纷为Gemini 3点赞。

36个月大逆转！他带着谷歌AI杀回来了，下一步世界模型

马斯克连发两个哭泣的表情包：看来我们要尽快推Grok 4.2了。

36个月大逆转！他带着谷歌AI杀回来了，下一步世界模型

新发布的Gemini 3具备领先的推理、多媒体处理和编码能力，擅长推理、生成视频和写代码。

谷歌强调，Gemini 3不只是一个更聪明的模型或聊天机器人，更重要的是它从发布之日起，就开始全面增强谷歌现有产品，包括其利润可观的搜索业务。

它是谷歌这台庞大的赚钱机器的AI引擎，用哈萨比斯的话说：

「我们是谷歌的动力引擎，现在我们正在让AI全面接入」。

哈萨比斯认为目前确实可能存在AI泡沫的问题，比如许多尚未经过检验的初创公司却拿到了数十亿美元的估值。

但在他看来，即便是AI泡沫真的破裂，Gemini 3也让谷歌有了穿越这场泡沫的底气。

把Google搜索塞进Gemini

谷歌内部，一直有一个把Google搜索「塞」进Gemini的想法。

这一想法，甚至可以追溯到谷歌早期。

当时的Larry Page和Sergey Brin就设想过把整个互联网都放进AI的「记忆」中，然后再对外提供服务。

因此，谷歌在上下文方面做了大量实验，并将上下文窗口提升到了100万个token，目前这个记录仍没真正被人打破。

哈萨比斯认为，机器理论上可以拥有比人类多几百万倍的存储/记忆空间，但如果只是「天真地」把所有东西暴力存下来，其实并不高效。

因此，与Google搜索「塞」进Gemini相比，谷歌更多是把Gemini作为现有产品的底层模型向用户开放。

此次Gemini 3一发布，谷歌已经正式通过Gemini应用，以及Google搜索中的AI Overviews功能向用户开放。

36个月大逆转！他带着谷歌AI杀回来了，下一步世界模型

据谷歌母公司Alphabet在7月的季度财报中表示，AI Overviews推动搜索查询量提升了10%。

同时，谷歌视觉搜索也出现了70%的激增，这项功能依赖于Gemini对照片的分析能力。

与OpenAI相比，谷歌的优势在于其产品「家底」深厚。

它拥有包括搜索、Google地图、Gmail、云服务等非常广泛的基础产品线。

而且，谷歌很早就开始利用AI来增强其已有产品的能力。

这使得它在与OpenAI、xAI、Anthropic等AI厂商的竞争中进可攻，退可守。

哈萨比斯表示，「在不利的情况下，我们会更加依靠这些基础产品；在有利的情况下，我们拥有最全面的布局和最具前瞻性的研究。」

谷歌也在考虑通过Gemini重启谷歌眼镜（Google Glass）项目。

哈萨比斯表示，当时谷歌眼镜步子迈得有点超前，缺少一个真正的「杀手级用例」，而通用助手正是这样一个用例。

因此，未来Gemini也将激活谷歌以往积累下来的「经验和遗产」，但是重点会放在「世界理解」上。

以Gemini为例，谷歌一开始就将机器人和眼镜视为两个非常重要的应用场景，因此决定走多模态路线。

如今，这些押注正在逐渐显现出成果，Gemini已经在多模态理解上显现出明显优势。

除了用AI增强现有和以往的产品之外，谷歌也在积极利用AI打造越来越受欢迎的新工具。

比如，NotebookLM，它可以根据文字材料自动生成播客；AI Studio，可以借助AI快速生成应用原型，等等。

此外，谷歌还探索将这项技术应用到游戏、机器人等领域。

哈萨比斯提到谷歌AI的一个优势，目前所有产品已经完全跑在Gemini技术栈上，实现了从产品到模型的「一体化」。

这意味着无论是产品改动，还是模型微调都会容易很多，而且产品也可以更好地学会理解和使用底层模型。

目前，哈萨比斯的重要精力，一半是将Gemini应用进一步加速做强，另一方面是将AI融入谷歌的各条业务线，使之成为谷歌的「AI动力舱」。

「我对这一切非常兴奋，目前我们只是刚刚触及未来可能性的表面，明年会更直观地看到这些变化」。

哈萨比斯表示。

被OpenAI「抢跑」后

谷歌正快速赶上

谷歌在AI领域长期投入巨大资源，并取得了一系列关键性突破。

包括在2017年发现了Transformer模型架构，但没有将其商业化，而是选择把它公开。

一直到2022年，OpenAI基于Transformer的ChatGPT爆火，动摇了谷歌的核心搜索业务，才令它深受震动，开始奋起直追。

有意思的是，OpenAI的崛起，不仅唤醒了谷歌在AI领域的加速发展，甚至还间接帮助谷歌避免了被分拆，出售其搜索业务的命运。

36个月大逆转！他带着谷歌AI杀回来了，下一步世界模型

如今，谷歌的搜索业务不仅没有被OpenAI等AI新势力所颠覆，相反它的AI模型还实现了对后者的反超。

与Gemini3相比，OpenAI在8月份发布的GPT-5令人略显失望。

一些评论者认为它「表现平平」，用户也抱怨其风格变得更正式。

据谷歌表示，Gemini 3在LM Arena等多个模型榜单上的表现优于GPT-5及其他模型，尤其在模拟推理以及长时间规划方面表现更佳，这有助于提升依赖工具或互联网的AI智能体的实际能力。

在早期的AI竞赛中，经历过一些磕磕绊绊之后，谷歌总算是「渐入佳境」了。

从用户活跃度上看，Gemini应用的月活用户已超过6.5亿，仅次于ChatGPT的7-8亿周活用户（如果换算成月活可能在10亿以上）。

每月有超过20亿人通过搜索里的AI Overviews使用Gemini；还有约1300万开发者在自己的产品中集成了Gemini。

这些数字表明谷歌正在逐渐缩短与OpenAI在AI领域的差距，作为谷歌AI总负责人的哈萨比斯也可以松口气了。

各方面都最强才叫AGI

实现还要5-10年

哈萨比斯表示，谷歌仍然在追求做「各方面都最强」的模型。

在他看来，这才是真正意义上的通用模型，也是最终通向通用人工智能（AGI）系统的关键组成部分。

从之前的几个版本到Gemini3，谷歌一直在修正Gemini模型的一些短板，使其在编程、推理、数学等能力上更进一步。

比如，此次Gemini 3就在2.5之上迭代，一方面升级它的基础能力，另一方巩固在多模态领域的优势。

哈萨比斯认为未来AI的技术路线会越来越收敛，而拥有一个通用、全能的基础模型将是一切的地基。

除此次发布的Gemini3 Pro外，Gemini模型家族里的其他成员也在打磨中，等到这些模型陆续就位之后，谷歌还将在产品分层服务上提供更大的灵活度。

简单来说，就是更强的性能，更低的价格。正如哈萨比斯所言：

「大方向是每一代新模型，都要在整体能力上更强，同时所需算力更便宜、更高效，带来更有竞争力的价格和更低的时延」。

目前，哈萨比斯在世界模型研究上花时间最多，在他看来这是通往AGI的关键组件。

同样，他也认为未来世界模型也将迎来类似ChatGPT那样的「爆发时刻」。

但最大的挑战是推理/服务成本，以及还要解决在更长时间尺度上保持世界一致性等关键难题，才能迎来真正的「破圈」时刻。

哈萨比斯表示，目前世界模型已经有了一些内部用例，比如用来训练其他智能体、机器人系统等。未来可能会出现一些非常酷的外部应用场景。

哈萨比斯仍然坚持他对通用人工智能（AGI）时间表的预测。

他认为距离真正意义上的完全实现AGI还有五到十年，而Gemini 3将成为未来打造更强大AI的重要平台，还需要在现有模型不断变强的基础上再取得一两次关键性突破。

在通往AGI的路上，哈萨比斯同样也有算力焦虑。

他坦言「即便将现在全世界的算力加在一起，也不够满足我们想做的所有事情」。

因此，需要在不同项目之间衡量算力投入的回报。比如，研究上的收益、新产品探索的价值，或是直接的收入等。

除了追求AGI，哈萨比斯还在带领DeepMind在AlphaEvolve等一些科学领域进一步扩展。

穿越AI泡沫的底气

谈到AI泡沫，哈萨比斯整体上还是比较乐观的，但他认为仍然存在一定的泡沫。

「那些几乎没有什么的项目，种子轮估值就能到几十亿美元，这在逻辑上有点行不通。」

对比这些泡沫，哈萨比斯认为谷歌的位置非常好。

就DeepMind而言，既有扎实营收，同时又承担着谷歌「AI动力舱」的重任；既有Gemini模型及App，还有基于Gemini的NotebookLM等AI优先产品。

哈萨比斯表示，目前AI已经在谷歌现有业务中看到了立竿见影的回报：正在为搜索、YouTube、云等业务「加功率」。

作为DeepMind的联合创始人，哈萨比斯早在12年前选择与谷歌「联手」时，已经考量过双方合作的价值：

谷歌可以提供海量的算力资源，同时它的产品又天然适合用AI去增强。目前，这条路正一步步变成现实。

在哈萨比斯看来，谷歌与DeepMind的结合，让现在的谷歌在AI竞争中处于一个非常有利的位置，使它有机会穿越泡沫，笑到最后。

参考资料：

https://sources.news/p/demis-hassibas-on-gemini-3-world?r=1r85f%20

https://www.wired.com/story/google-launches-gemini-3-ai-bubble-search/

文章来自于“新智元”，作者 “元宇”。

关键词: AI新闻 , 谷歌AI , AI大厂 , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner