验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路
7258点击    2025-10-25 13:09

从“AI没什么用”到“AI三年内将终结人类工作”,这片巨大的认知鸿沟,就是我们身处的2025年。


在这片喧嚣和迷雾之中,我们迫切需要一个清晰的导航图。而Jason Wei正是提供这份地图的最佳人选之一。他现任Meta超级智能实验室(Meta Super Intelligence Labs)的研究科学家,此前在OpenAI工作了两年,o1研发的主导者,更早之前是Google Brain的科学家。他是“思维链提示”(Chain of Thought Prompting)、“指令调优”(Instruction Tuning)等现代AI基石技术的普及者,其研究在AI世界中拥有超过9万次引用,仅CoT一篇就超过2万次。


最近,斯坦福AI俱乐部的一次演讲中,Wei提出了他认为理解和驾驭2025年AI发展的三个“简单但可能很根本”的核心观点。这三个观点,如三盏探照灯,穿透了当下的炒作与焦虑,为我们勾勒出了一幅关于未来智能、工作乃至社会结构的清晰蓝图。


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路


观点一:智能将成为一种商品


第一个核心观点是颠覆性的:智能,以及获取知识和进行推理的能力,正在快速成为一种廉价的商品,其成本和获取难度正被无情地推向零 (Intelligence as a Commodity)


Wei将AI的进展划分为两个截然不同的阶段:


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路


  1. 阶段一:推动前沿 (Pushing the Frontier)在这个阶段,AI还不能很好地完成某项任务(例如,在MMLU这样的基准测试上取得高分),研究人员的核心工作是“解锁”这项新能力。
  2. 阶段二:商品化 (Commoditized)一旦某个能力被AI掌握,这个能力的成本就会迅速“商品化”。


Wei用一张图表展示了这一点:在MMLU基准上达到特定智能水平的“成本”(以美元计),正随着时间(每年)急剧下降。换言之,去年的“尖端智能”,到了今年可能只需要花费几分之一的成本就能获得。


为什么智能会“通货膨胀”?答案:自适应计算


为什么这个“智能通缩”的趋势会持续下去?。Wei给出了一个关键的技术解释:“自适应计算”(Adaptive Compute)的真正实现


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路


他指出,在深度学习的绝大部分历史中(直到去年左右),我们都处于“固定计算”模式。这意味着,无论你问AI一个多简单的问题(比如“加州的首都是哪里”)还是一个多复杂的问题(比如“一个竞赛级数学难题”),模型都会调用几乎相同的、固定的计算量来回答。


而现在,我们进入了“自适应计算”的时代。AI可以根据任务的难度来动态调整用于解决它的计算量。


这个转变的意义是革命性的。它意味着我们不再需要仅仅依靠“不断扩大模型规模”来降低成本。对于一个非常简单的任务,我们现在可以将计算成本“推向极限”,只花费最微量的算力去完成它。这从根本上解锁了智能成本下降的通道。


从几小时到几分钟再到“即时”:知识获取的崩溃


这种商品化的最直观体现,就是获取公开信息所需时间的急剧缩短。Wei用了一个关于“釜山”的例子生动地说明了这一点:


  • 问题1(简单):“1983年釜山的人口是多少?”
  • 前互联网时代:你可能需要开车去图书馆,翻阅几本百科全书,耗时“几小时”。
  • 互联网时代:你需要搜索,然后浏览几个网页以确认答案,耗时“几分钟”。
  • 聊天机器人时代:这个答案是“即时”的。
  • 问题2(困难):“1983年釜山有多少对夫妇结婚?”
  • 前互联网时代:如果你不在韩国,你可能得先“飞到韩国”,然后去政府图书馆的档案室,“翻阅几十本书”才能找到这个特定数据。这可能需要数周。
  • 互联网时代:你可能需要搜索,但如果你不懂韩语,你得在大量网站中挣扎。
  • AI代理时代:Wei展示,AI(OpenAI Operator)现在可以做到这一点,因为它能访问并操作特定数据库(如Kosis),通过“点击和查询”来获取答案。这可能只需要“几分钟”。
  • 问题3(极难):“1983年亚洲人口最多的30个城市中,请按当年的结婚夫妇数量排序。”
  • 前互联网时代:这几乎是一个需要耗费“数周”的研究项目。
  • AI代理时代:这在今天可能只需要“几小时”就能完成。


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路


为了量化这种能力,OpenAI甚至开发了一个名为“BrowseComp”(浏览竞赛)的基准测试。这些任务的特点是,一旦你有了答案,验证它很容易,但找到答案的过程却极其耗时。Wei展示的数据触目惊心:对于这些任务,人类平均需要“超过两小时”才能解决一个,而且在更多情况下,人类在两小时内“无法解决”。相比之下,OpenAI的Deep Research模型已经能解决大约一半的此类问题。


“智能商品化”的启示


这个观点的结论是清晰的:一旦AI掌握了某项能力,它的成本就会趋向于零。这对我们的社会结构意味着什么?


  1. 知识的民主化:那些以前被“任意的知识壁垒”所保护的领域将被彻底民主化。Wei点名了两个领域:编程(Coding) 和 个人健康(Personal Health)。过去,你想做“生物黑客”实验,医生可能不会配合你。而现在,ChatGPT几乎可以给你“一个非常好的医生能给你的任何信息”。
  2. 私人信息价值的飙升:当所有“公共信息”的获取成本都变为零时,一个必然的经济推论是——“私人和内幕信息”的相对价值将会变得高得多。例如,那些“不在市场上但可以被出售的房子”的信息,现在变得更有价值了。
  3. 个性化互联网的到来:我们最终将从访问一个“对所有人开放的公共互联网”,转向获取“个性化的互联网”。你想要的任何信息,都会有一个个性化的网站为你生成。


观点二:验证者定律


如果说第一个观点解决了智能的“成本”问题,那么第二个观点则解决了AI进展的“方向”问题。这个观点,Wei称之为“验证者定律”(Verifier's Law)。


其核心论断是:我们训练AI解决某个特定任务的能力,与我们“验证”该任务是否被正确完成的容易程度成正比


这个定律的推论是:任何可解的、且易于验证的任务,最终都将被AI攻克


万物皆可量化:验证的不对称性


这个定律的基础,是计算机科学中一个经典概念:“验证的不对称性”(Asymmetry of Verification)。即,对于许多任务,验证一个解决方案是否正确,要远比从头开始找到这个解决方案容易得多。


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路


Wei举了几个绝佳的例子,我们可以将其绘制成一个光谱:


  • 极易验证(AI优势区)
  • 数独 (Sudoku):解决起来非常困难,但检查一个填好的数独是否符合规则,极其容易。
  • Twitter的代码:编写运行Twitter的全部代码,需要数千名工程师。但验证它是否在工作?你只需要“渲染它并四处点击一下”。
  • 极难验证(AI劣势区)
  • 撰写事实性文章:AI可以轻易地生成一篇“看似真实可信”的文章。但是,要去“核查”文中的每一个事实 claim,可能“极其繁琐”,耗时远超写作本身。这是一个“反向不对称”的例子。
  • 创造一种新饮食法:Wei开玩笑说,他可以在10秒内断言“最好的饮食法是只吃野牛”。但是,你要如何“验证”这个断言?你需要“大量的样本,等待长期的结果,而且过程可能充满噪音”。
  • 对称任务(中间地带)
  • 数据处理代码:有时候,你写一个脚本很容易,但让你去检查“别人写的混乱代码”到底在干什么,可能比你自己重写一遍还要花时间。


什么是真正的“可验证性”?


Wei进一步将“可验证性”这门艺术,拆解为五个关键因素:


  1. 客观事实 (Objective Truth):是否存在一个关于“好”与“坏”的客观标准?
  2. 验证速度 (Fast to Verify):验证一个答案需要多久?
  3. 可扩展性 (Scalable):你能不能同时验证“一百万个”提议的解决方案?
  4. 低噪音 (Low Noise):每次验证的结果是否都一样?
  5. 连续奖励 (Continuous Reward):你是否只能得到“通过/不通过”的二元答案,还是能得到一个“完整的光谱”(比如这个答案比那个答案好5%)?


所有的AI基准测试,本质上都是“易于验证”的,这解释了为什么AI在刷榜上进展神速。


案例研究:AlphaEvolve如何证明“验证者定律”


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路


Wei指出,DeepMind的AlphaEvolve项目,是利用这种不对称性的完美范例。该算法通过投入海量计算,在“采样”和“智能算法”的配合下,解决了一系列符合高度不对称性的任务。


例如一个数学问题:找到11个六边形的最佳摆放方式,使包裹它们的“外部六边形”面积最小。


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路


这个任务完美符合了上述所有验证标准:它是客观的(可以绘图检查),可扩展的(计算验证),低噪音的(每次计算结果都一样),并且提供连续奖励(六边形的大小本身就是一个精确的优劣指标)。


AlphaEvolve的算法流程简单而粗暴:


  1. 让大型语言模型 (LLM) “采样”一堆候选解决方案(有好有坏)。
  2. 用“验证器”(即评分程序)给所有方案打分。
  3. 将“最好的”方案喂给LLM,作为下一轮采样的“灵感”。
  4. 投入大量算力和迭代,性能就会持续提高。


这个方法非常聪明,它甚至“绕过”了传统的泛化问题。它不需要模型学会解决所有六边形问题,它只需要找到这一个特定问题的最优解。感兴趣您可以看下

离AGI更近了!!0.31元运行谷歌的AlphaEvolve和UBC的DGM「达尔文-哥德尔机」

“验证者定律”的启示


这个定律为我们指明了AI自动化的清晰路线图:


  1. 自动化的顺序:最先被自动化、被AI征服的,一定是那些“验证起来微不足道”的任务。
  2. “测量”是新的金矿:Wei认为,一个即将爆发的商业领域是:“想出衡量事物的方法”。因为一旦某个事物(比如“员工幸福度”或“代码优雅度”)可以被精确、快速、客观地测量,那么它就可以被AI所优化。


观点三:智能的锯齿状边缘 


Wei的第三个观点,也是最具现实指导意义的观点,是关于AI发展的“形态”。他认为,AI的能力和进步速度,并不是一条平滑向上的曲线,而是一个“锯齿状的边缘” (Jagged Edge)。


值得一题的是,Jason Wei 在他演讲中所使用的“锯齿状边缘” (Jagged Edge) 理论,最早由哈佛商学院的研究者们率先提出。 早在2023年,哈佛商学院(HBS)联合波士顿咨询集团(BCG)、MIT和沃顿商学院,共同发布了一篇名为《驾驭锯齿状的技术前沿:人工智能对知识型员工生产力和质量影响的现场实验证据》的重磅研究报告。感兴趣您可以看下:


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路

哈佛波士顿最新技术前沿:人工智能将在未来几年对知识工作者产生巨大影响

这份报告的权威性,不仅在于其顶级的研究阵容,更在于它进行了一项史无前例的大规模“现场实验”:研究团队深入BCG内部,让758名真实的顶尖咨询顾问 参与了一场使用GPT-4的随机对照试验


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路


这份研究报告首次用真实数据绘制了AI能力的“锯齿状前沿” (Jagged Technological Frontier),其核心发现震惊了业界:


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路




Jason Wei 的演讲,正是在这个坚实的实证研究基础上,进一步阐述了“锯齿状边缘”对未来AI发展速度和职业变迁的深刻含义。


为什么不会有“快速起飞”的超级智能


在AI安全和未来学领域,流行着一种“快速起飞”(Fast Takeoff)的假说。该假说认为,AI一旦在某个关键点上超越人类,就会在极短的时间内(即“起飞持续时间”)获得“巨大”的智能优势,迅速甩开人类。


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路


Wei明确表示:他认为这“可能不会发生”


他的理由是,“自我完善能力”并不是一个“是/否”的二元开关。现实更可能是一个渐进的光谱:


  • 第0年:AI甚至无法获取自己的代码库。
  • 第0.5年:AI可以“训练一些东西”,但结果“并不惊艳”。
  • 第1年:AI可以“自主训练”,但效果不如10个顶尖人类研究员。
  • 第2年:AI可以自主训练,但仍需要人类“时不时地干预”以保持良好运行。


最重要的是,自我完善的速度应该是“针对每个任务”来看待的。AI不会在“所有事情”上同时变得更强。AGI短期之内不会到来。持有这种观点的还有


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路

你是对的,AGI一年内不会出现了!学术界对AGI的定义来了,27家机构最新

欢迎来到“锯齿状”世界:高峰与低谷


AI的能力图谱充满了“高峰”(AI表现超常)和“低谷”(AI表现愚蠢)。


  • 高峰(Peaks):AI目前特别擅长的任务,比如“困难的数学问题”或“某些类型的竞赛编程”。
  • 低谷(Valleys):那些AI表现很差的奇怪领域。例如,很长一段时间里,ChatGPT会坚持认为“9.11 大于 9.9”。或者,AI根本无法说好“特林吉特语”(Tlingit),一种只有几百名美国原住民会说的语言。


更关键的是,改进的速度也是“锯齿状”的。有些任务(比如那些可验证的)会改进得非常快。而另一些任务(比如学会说特林吉特语),其瓶颈在于现实世界——你必须“去到那个原住民保留地,去记录那种语言”。AI的算法再快,也无法加速这个物理过程。


预测AI进步的3+1条启发式规则


那么,我们该如何预测AI在某个特定任务上的进步速度?Wei给出了一个强大的预测工具包,包含三条核心规则和一个例外:


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路


2025+ 的职业预测:谁会留下,谁会离开?


基于这套“锯齿状”理论和启发式规则,Wei给出了一个关于未来职业的惊人预测表:


验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路


这个表格清晰地展示了“锯齿状”的未来:


  • 被AI重度加速的领域:软件开发、电影制作、研究。它们都是“数字化的”。
  • 几乎不受AI影响的领域:理发、管道维修、手工制造。它们受制于“物理世界”的瓶颈。


结论:在“锯齿状”的未来中导航


Jason Wei的演讲为我们提供了三把标尺,用以丈量这个被AI重塑的世界。


  1. 智能商品化:智能和知识正变得快速而廉价。这意味着依赖“信息差”的壁垒正在崩溃。
  2. 验证者定律:“可测量性”和“可验证性”是AI进步的核心驱动力。自动化将沿着“最容易验证”的路径展开。
  3. 锯齿状边缘:AI的进步是不均衡的。未来不是一个“AGI”突然降临的世界,而是一个“数字领域”被极大加速、而“物理领域”相对停滞的、极度不均衡的世界。


这三个观点合在一起,描绘了一幅比“AI将终结一切”或“AI毫无用处”都复杂得多,但也真实得多的未来图景。


对于那些处于焦虑中的人来说,这幅蓝图给出了清晰的答案:AI的冲击不是均匀的,而是高度结构化的。你的未来,取决于你的工作在多大程度上是数字的数据丰富的、以及易于验证的


与其在“起飞或不起飞”的二元论中恐慌,不如开始校准自己的坐标,找到自己的“人马”(Centaurs,清晰分工) 和“赛博格”(Cyborgs,高度整合)。学会如何在AI创造的这个“锯齿状”新大陆上,攀登属于自己的高峰。



文章来自于微信公众号 “AI修猫Prompt”,作者 “AI修猫Prompt”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0