36个月大逆转!他带着谷歌AI杀回来了,下一步世界模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
36个月大逆转!他带着谷歌AI杀回来了,下一步世界模型
6334点击    2025-11-24 10:18

ChatGPT发布距今已近36个月,面对OpenAI的领先,哈萨比斯带领谷歌AI全面反攻,通过新发布的Gemini 3强势回归。Gemini 3在LM Arena等多个模型榜单登顶,表现优于GPT-5及其他模型,上演了一场完美逆袭。


大模型排行榜,你方唱罢我登场。


马斯克的Grok 4.1刚登顶,随后就被Gemini 3 Pro反超了,上演了一幕AI版的「速度与激情」!


36个月大逆转!他带着谷歌AI杀回来了,下一步世界模型

谷歌DeepMind CEO哈萨比斯(Demis Hassabis)


哈萨比斯在X平台上兴奋地晒出Gemini 3的成绩单,称其「当然地」登顶各大排行榜,并表示这是自己迄今为止最爱的模型。


36个月大逆转!他带着谷歌AI杀回来了,下一步世界模型


就连奥特曼和马斯克,也纷纷为Gemini 3点赞。


36个月大逆转!他带着谷歌AI杀回来了,下一步世界模型


36个月大逆转!他带着谷歌AI杀回来了,下一步世界模型


马斯克连发两个哭泣的表情包:看来我们要尽快推Grok 4.2了。


36个月大逆转!他带着谷歌AI杀回来了,下一步世界模型


新发布的Gemini 3具备领先的推理、多媒体处理和编码能力,擅长推理、生成视频和写代码。


谷歌强调,Gemini 3不只是一个更聪明的模型或聊天机器人,更重要的是它从发布之日起,就开始全面增强谷歌现有产品,包括其利润可观的搜索业务。


它是谷歌这台庞大的赚钱机器的AI引擎,用哈萨比斯的话说:


「我们是谷歌的动力引擎,现在我们正在让AI全面接入」。


哈萨比斯认为目前确实可能存在AI泡沫的问题,比如许多尚未经过检验的初创公司却拿到了数十亿美元的估值。


但在他看来,即便是AI泡沫真的破裂,Gemini 3也让谷歌有了穿越这场泡沫的底气。


把Google搜索塞进Gemini


谷歌内部,一直有一个把Google搜索「塞」进Gemini的想法。


这一想法,甚至可以追溯到谷歌早期。


当时的Larry Page和Sergey Brin就设想过把整个互联网都放进AI的「记忆」中,然后再对外提供服务。


因此,谷歌在上下文方面做了大量实验,并将上下文窗口提升到了100万个token,目前这个记录仍没真正被人打破。


哈萨比斯认为,机器理论上可以拥有比人类多几百万倍的存储/记忆空间,但如果只是「天真地」把所有东西暴力存下来,其实并不高效。


因此,与Google搜索「塞」进Gemini相比,谷歌更多是把Gemini作为现有产品的底层模型向用户开放。


此次Gemini 3一发布,谷歌已经正式通过Gemini应用,以及Google搜索中的AI Overviews功能向用户开放。


36个月大逆转!他带着谷歌AI杀回来了,下一步世界模型


据谷歌母公司Alphabet在7月的季度财报中表示,AI Overviews推动搜索查询量提升了10%。


同时,谷歌视觉搜索也出现了70%的激增,这项功能依赖于Gemini对照片的分析能力。


与OpenAI相比,谷歌的优势在于其产品「家底」深厚。


它拥有包括搜索、Google地图、Gmail、云服务等非常广泛的基础产品线。


而且,谷歌很早就开始利用AI来增强其已有产品的能力。


这使得它在与OpenAI、xAI、Anthropic等AI厂商的竞争中进可攻,退可守。


哈萨比斯表示,「在不利的情况下,我们会更加依靠这些基础产品;在有利的情况下,我们拥有最全面的布局和最具前瞻性的研究。」


谷歌也在考虑通过Gemini重启谷歌眼镜(Google Glass)项目。


哈萨比斯表示,当时谷歌眼镜步子迈得有点超前,缺少一个真正的「杀手级用例」,而通用助手正是这样一个用例。


因此,未来Gemini也将激活谷歌以往积累下来的「经验和遗产」,但是重点会放在「世界理解」上。


以Gemini为例,谷歌一开始就将机器人和眼镜视为两个非常重要的应用场景,因此决定走多模态路线。


如今,这些押注正在逐渐显现出成果,Gemini已经在多模态理解上显现出明显优势。


除了用AI增强现有和以往的产品之外,谷歌也在积极利用AI打造越来越受欢迎的新工具。


比如,NotebookLM,它可以根据文字材料自动生成播客;AI Studio,可以借助AI快速生成应用原型,等等。


此外,谷歌还探索将这项技术应用到游戏、机器人等领域。


哈萨比斯提到谷歌AI的一个优势,目前所有产品已经完全跑在Gemini技术栈上,实现了从产品到模型的「一体化」。


这意味着无论是产品改动,还是模型微调都会容易很多,而且产品也可以更好地学会理解和使用底层模型。


目前,哈萨比斯的重要精力,一半是将Gemini应用进一步加速做强,另一方面是将AI融入谷歌的各条业务线,使之成为谷歌的「AI动力舱」。


「我对这一切非常兴奋,目前我们只是刚刚触及未来可能性的表面,明年会更直观地看到这些变化」。


哈萨比斯表示。


被OpenAI「抢跑」后

谷歌正快速赶上


谷歌在AI领域长期投入巨大资源,并取得了一系列关键性突破。


包括在2017年发现了Transformer模型架构,但没有将其商业化,而是选择把它公开。


一直到2022年,OpenAI基于Transformer的ChatGPT爆火,动摇了谷歌的核心搜索业务,才令它深受震动,开始奋起直追。


有意思的是,OpenAI的崛起,不仅唤醒了谷歌在AI领域的加速发展,甚至还间接帮助谷歌避免了被分拆,出售其搜索业务的命运。


36个月大逆转!他带着谷歌AI杀回来了,下一步世界模型


如今,谷歌的搜索业务不仅没有被OpenAI等AI新势力所颠覆,相反它的AI模型还实现了对后者的反超。


与Gemini3相比,OpenAI在8月份发布的GPT-5令人略显失望。


一些评论者认为它「表现平平」,用户也抱怨其风格变得更正式。


据谷歌表示,Gemini 3在LM Arena等多个模型榜单上的表现优于GPT-5及其他模型,尤其在模拟推理以及长时间规划方面表现更佳,这有助于提升依赖工具或互联网的AI智能体的实际能力。


在早期的AI竞赛中,经历过一些磕磕绊绊之后,谷歌总算是「渐入佳境」了。


从用户活跃度上看,Gemini应用的月活用户已超过6.5亿,仅次于ChatGPT的7-8亿周活用户(如果换算成月活可能在10亿以上)。


每月有超过20亿人通过搜索里的AI Overviews使用Gemini;还有约1300万开发者在自己的产品中集成了Gemini。


这些数字表明谷歌正在逐渐缩短与OpenAI在AI领域的差距,作为谷歌AI总负责人的哈萨比斯也可以松口气了。


各方面都最强才叫AGI

实现还要5-10年


哈萨比斯表示,谷歌仍然在追求做「各方面都最强」的模型。


在他看来,这才是真正意义上的通用模型,也是最终通向通用人工智能(AGI)系统的关键组成部分。


从之前的几个版本到Gemini3,谷歌一直在修正Gemini模型的一些短板,使其在编程、推理、数学等能力上更进一步。


比如,此次Gemini 3就在2.5之上迭代,一方面升级它的基础能力,另一方巩固在多模态领域的优势。


哈萨比斯认为未来AI的技术路线会越来越收敛,而拥有一个通用、全能的基础模型将是一切的地基。


除此次发布的Gemini3 Pro外,Gemini模型家族里的其他成员也在打磨中,等到这些模型陆续就位之后,谷歌还将在产品分层服务上提供更大的灵活度。


简单来说,就是更强的性能,更低的价格。正如哈萨比斯所言:


「大方向是每一代新模型,都要在整体能力上更强,同时所需算力更便宜、更高效,带来更有竞争力的价格和更低的时延」。


目前,哈萨比斯在世界模型研究上花时间最多,在他看来这是通往AGI的关键组件。


同样,他也认为未来世界模型也将迎来类似ChatGPT那样的「爆发时刻」。


但最大的挑战是推理/服务成本,以及还要解决在更长时间尺度上保持世界一致性等关键难题,才能迎来真正的「破圈」时刻。


哈萨比斯表示,目前世界模型已经有了一些内部用例,比如用来训练其他智能体、机器人系统等。未来可能会出现一些非常酷的外部应用场景。


哈萨比斯仍然坚持他对通用人工智能(AGI)时间表的预测。


他认为距离真正意义上的完全实现AGI还有五到十年,而Gemini 3将成为未来打造更强大AI的重要平台,还需要在现有模型不断变强的基础上再取得一两次关键性突破。


在通往AGI的路上,哈萨比斯同样也有算力焦虑。


他坦言「即便将现在全世界的算力加在一起,也不够满足我们想做的所有事情」。


因此,需要在不同项目之间衡量算力投入的回报。比如,研究上的收益、新产品探索的价值,或是直接的收入等。


除了追求AGI,哈萨比斯还在带领DeepMind在AlphaEvolve等一些科学领域进一步扩展。


穿越AI泡沫的底气


谈到AI泡沫,哈萨比斯整体上还是比较乐观的,但他认为仍然存在一定的泡沫。


「那些几乎没有什么的项目,种子轮估值就能到几十亿美元,这在逻辑上有点行不通。」


对比这些泡沫,哈萨比斯认为谷歌的位置非常好。


就DeepMind而言,既有扎实营收,同时又承担着谷歌「AI动力舱」的重任;既有Gemini模型及App,还有基于Gemini的NotebookLM等AI优先产品。


哈萨比斯表示,目前AI已经在谷歌现有业务中看到了立竿见影的回报:正在为搜索、YouTube、云等业务「加功率」。


作为DeepMind的联合创始人,哈萨比斯早在12年前选择与谷歌「联手」时,已经考量过双方合作的价值:


谷歌可以提供海量的算力资源,同时它的产品又天然适合用AI去增强。目前,这条路正一步步变成现实。


在哈萨比斯看来,谷歌与DeepMind的结合,让现在的谷歌在AI竞争中处于一个非常有利的位置,使它有机会穿越泡沫,笑到最后。


参考资料:

https://sources.news/p/demis-hassibas-on-gemini-3-world?r=1r85f%20

https://www.wired.com/story/google-launches-gemini-3-ai-bubble-search/


文章来自于“新智元”,作者 “元宇”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner