谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?
9036点击    2026-01-08 08:44

当整个科技圈都在为「谷歌黑魔法」集体高潮时,真相恐给了所有人一记耳光。那套被捧上神坛的「并行验证循环」,不过是社交网络上AI生成的「赛博跳大神」。


如果说之前的AI模型是在模拟人类的思考,那么Gemini 3 Flash就是在模拟人类的「直觉」。


3倍于Gemini 2.5 Pro的速度,却拥有超越Pro级的推理能力。


更离谱的是,它的智力竟然在某些基准测试超越了自家的Pro大哥。


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


但目前为止,依然没人能说明白:Flash凭为什么比Pro还要「聪明」。


谷歌DeepMind到底有啥黑魔法?


「林子大了,什么鸟都有」,以至于X上网友Jainam Parmar爆料:


AlphaGo团队根本不使用思维链。


他们采用并行验证循环机制。


这套方法正在碾压你听说过的所有「高级推理」技术。


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


成千上万的网友浏览过这个帖子。


这靠谱吗?这有没有可能是「以讹传讹」、用AI生成的「假新闻」?


如果是假新闻,难道只是因为「DeepMind碾压同行的推理」这样的噱头吗?


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


我们先看一下推文到底讲了啥。


谷歌DeepMind的黑科技?


首先,这位「万能的网友」直击CoT命门,解释了为什么Chain-of-Thought很糟糕。


当前的AI推理是线性的:


思考步骤1→步骤2→步骤3。


但这并不是专家级问题解决者的思维方式。


然后,他写道:「DeepMind分析了他们的AlphaGo团队是如何应对复杂问题的,结果发现了一件非常惊人的事情。」


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


并行验证循环(Parallel Verification Loops):


专家型思考者并不会沿着一条冗长的推理链一路走到底,而是同时运行多个验证循环。


他们会提出一个解决方案,用约束条件去检验它;必要时回退;同时探索其他可能的路径——这些过程是并行发生的。


而Chain-of-Thought做不到这一点。


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


架构上的差异(The Architecture Difference):


传统的思维链:A→B→C→D(线性) 


DeepMind的框架:A→[B1,B2,B3]→分别验证→精炼→迭代


这就好比是在一条路上一直往前走,而另一种方式则是同时探索整棵决策树。


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


结果非常夸张:


在复杂推理基准测试中:


  • 相比标准的Chain-of-Thought,性能提升37%
  • 捕捉逻辑错误的能力提升52%
  • 收敛到正确解的速度快了3倍


这不是小幅优化,而是架构层面的飞跃


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


它实际是如何运作的


步骤1:同时生成多个候选解决方案


步骤2:每个方案各自运行一套验证循环


步骤3:不同方案之间进行交叉验证


步骤4:剪除较弱的分支,强化更有潜力的路径


步骤5:持续迭代,直到收敛


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


自我纠错优势:


这才是杀手级特性:系统在给出最终答案之前,就能发现并纠正自己的错误。


传统的CoT(思维链)是按步骤顺序「提交」的,只要其中一步出错,后面就全盘皆输。


并行验证允许在不中断整体流程的情况下回溯和修正,而不必从头再来。


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


对训练方式的影响:


他们不只是测试了这种方法,而是直接用这一框架来训练模型


模型学会了:


  • 提出多个假设
  • 让这些假设相互检验
  • 通过验证逐步建立置信度
  • 尽早剪除错误或低质量的推理路径


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


现实世界中的应用:


这一框架在以下场景中表现尤为强大:


  • 数学证明(一步出错,整体就会崩塌)
  • 代码调试(可能同时存在多个潜在Bug)
  • 战略规划(需要探索复杂的决策树)
  • 科学推理(假设提出与验证)


凡是正确性优先于速度的地方,它都具备压倒性优势。


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


如果你正在构建AI智能体或推理系统,Chain-of-Thought已经过时了。


未来属于并行验证(Parallel Verification)


生成多条路径。


对它们进行测试。


让最优解自然浮现。


这正是AlphaGo击败世界冠军的方式。


这也是推理真正运作的方式。


疑点重重,被AI袭击的一天?


在这些描述中,「并行验证」简直就是为数学证明和代码调试量身定制的终极武器。


凡是追求正确性的场景,它似乎都能实现降维打击。


这套理论听起来是不是太完美了?简直就像是DeepMind真的把人类直觉代码化了一样。


但恰恰是这种「过度的完美」和「极具煽动性」的文风,引起了业内人士的警觉。


当成千上万的网友还在为这套「黑魔法」转发点赞时,冷静下来的人们开始追问一个最基本的问题:


这套东西,到底是谁说的?


发帖的Jainam Parmar,也不是什么AI研究领域的大牛,也不是谷歌DeepMind的员工。


他也没有明确给出DeepMind的可信的源链接。


他说的靠谱吗?


即使DeepMind放缓发布世界知名的研究成果,以便在AI竞赛中赢得先机。


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


但DeepMind仍在发布他们的研究成果。


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


去年11月初,谷歌DeepMind团队还发布了号称解决「可持续学习」难题的新的机器学习范式──嵌套学习(nested learning)。


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


原推文那种藏头露尾、吊人胃口的写作风格,令人不喜,甚至部分网友怀疑,帖子压根就是大模型生成的!


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


熟悉DeepMind研究工作的网友,则认为帖子在故弄玄虚,甚至歪曲原意!


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


更有网友毫不客气地指出,发帖人就是蹭热度,半年前他还在鼓吹「CoT就是下一代推理技术」。


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


还有更关键的证据,之后,另一网友Chris Laub发布了一模一样的内容:


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


帖子底下,也有网友怀疑,这就是诱导人点击的AI垃圾!


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


事实上,CoT早不是什么先进技术。


长思维链和短思维链截然不同。


长思维链,有三大关键特征: 深度推理、广泛探索和可行的反思。


这些特征使得模型能够处理更复杂的任务,并且与较浅的短思维链相比,产生更高效、更连贯的结果。


谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?


回到问题本身:Gemini 3 Flash 到底凭什么更聪明?


至少目前,没有任何可靠证据表明DeepMind已将「并行验证循环」作为核心推理框架,全面取代Chain-of-Thought。


相反,这场风波更像一次典型的 AI 舆论实验—— 当模型表现出现异常跃迁,人们总是更愿意相信「黑魔法」,而不是渐进式优化。


真正值得警惕的,也许不是CoT是否过时,而是我们是否过度迷信单一解释


推理的未来,未必只有一条路,但谣言,往往只需要一条推文。


参考资料:

https://github.com/LightChen233/Awesome-Long-Chain-of-Thought-Reasoning

https://x.com/iruletheworldmo/status/2007550905177256071

https://x.com/aiwithjainam/status/2005629090943193552

https://x.com/ChrisLaubAI/status/2006668516280197287


文章来自于“新智元”,作者 “KingHZ”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md