人类打字速度,竟成了制约AGI的瓶颈?近日,OpenAI Codex负责人Alexander Embiricos爆出了这一惊人观点。Embiricos还预测,2026年,当AI开始在一些领域具备自我审查能力,将触发生产力出现「曲棍球杆式」飞跃增长,并带动人类迈向AGI。
拖AGI后腿的,竟是人类打字手速太慢?
没错,这是OpenAI的Codex负责人Alexander Embiricos的观点。
他在近日《Lenny's Podcast》播客中表示,人类的打字速度正在拖慢通往AGI的进展。

Lenny(左)与Alexander Embiricos(右)在播客中
当Lenny问到通往AGI的时间表时,Embiricos谈到了他目前看到的一个限制因素:人类的打字速度或者是多任务处理能力。

除了Embiricos之外,奥特曼、Amodei、马斯克等许多大佬也曾多次提到这个问题。
他们普遍将这一问题描述为人机协作过程中的「沟通」「摩擦」问题。
比如,奥特曼曾多次表示AI进步不会只靠继续做大模型。
近期他在介绍AgentKit时,提到开发这套工具是为了让开发者能更低摩擦、更高效地构建智能Agent系统,而不是在分散工具和复杂流程之间低效拼接。

同样,Anthropic CEO Dario Amodei也在今年4月份提到,AI可能在3到6个月编写90%的代码,12个月内「基本上编写所有代码」。
但他同时补充指出程序员仍需明确实现的功能、应用设计思路及决策,因此在短期内人类开发者的参与仍是关键。
这说明即便是AI基本上可以完成所有代码的编写,仍然需要开发人员的介入,因此人机协作的效率就显得十分重要。
更早的时候,马斯克就预见到这一问题。

他在谈到Neuralink项目时曾提到开发脑机接口,目的之一就是为了绕过人类打字速度的限制。
他认为人类传输数据的速度远远慢于计算机:
「人类对计算机说话,在计算机听来会像是非常缓慢的、带有音调的喘息声,有点像鲸鱼的声音」。
这些大佬的观点,都呼应了Embiricos的观察,揭示出诸如文字输入等人类自身的能力瓶颈,正在成为通往AGI的隐形障碍。
这类似于早期计算机时代,程序员必须手动输入每一行代码,开启了人机交互和自动化的进程。
而随着AI的飞速发展,如今人类的输入速度已经跟不上AI的思考,成了其发展的瓶颈。
就像一位网友说的,如果打字速度是瓶颈,我们就是系统中速度最慢的环节了。

人类打字速度耽误AGI,Embiricos这一观点并非空穴来风,而是基于他对AI代理系统实际应用的深刻观察。
他认为当前AI模型虽然在处理复杂任务时表现出色,但它们仍高度依赖人类通过文本输入来指导和验证.
而人类的打字速度以及处理多任务能力,已经无法跟上AI的处理能力。
其中核心难点在于提示词工程,它要求人类精确表述意图。
但是人类的多任务处理涉及工作记忆的切换,每次切换都需要时间和精力,这导致提示词工程效率的低下。
在Codex使用过程中,开发者需同时监控AI输出、调整提示,Embiricos将之类比为驾驶员手动控制自动驾驶汽车。
在这个过程中,人类需要多任务处理,同时思考问题、撰写提示、审查输出,其中的任务量远远超单纯打字的速度问题(打字输入只是人类思考意图的实现,是最后一个环节),由此也形成了制约AI生产力突破的瓶颈。
以安卓版Sora应用的开发为例。
据OpenAI官方透露,该应用仅动用了4人小队,28天就完成了上线。
其中约85%的代码由GPT-5.1+Codex自动生成,实现了99.9%的版本稳定率。
虽然将传统几个月的工时被压缩到28天,但这个过程中也暴露出AI编程的软肋。
Codex就像一名记忆为零的新手高级工程师。
每一次对话,都必须通过提示词清晰地告诉它要怎么做,才能生成高质量的代码。
整个过程中监督、审查、逻辑确认、调试等需要依赖人工介入的工作,就成了工程中最慢、也是最关键的部分。
这一切都需要人工思考并输入提示词。
于是,打字速度突然成了真正的生产力障碍。
前不久,OpenAI前首席科学家Ilya Sutskever提到的模型在评测时技能爆表,一到实际场景就掉链的「性能悖论」,也在间接上证明了Embiricos的判断:
他在谈到为什么目前依赖Scaling(堆算力和数据)越来越难推动AI进展时,提到了一个关于模型在修Bug时陷入无限循环的例子:
你让AI修一个Bug,它修好了,但引入了一个新的Bug;
你指出这个新Bug,它去修却又把第一个Bug带回来了;
模型就这样在两个Bug之间来回折返,像在无限循环(ping-pong)。

这个例子暴露出当前大模型的训练方法更多是在优化评测指标,而不是生成真正类似人类的理解与泛化能力。
即使最先进的AI模型,在实际应用场景中人机交互仍然是不可或缺的,这也使得人类能力,在某种程度上成了AI的生产力瓶颈。

就像网友Jeff Lurie所言,Embiricos提出了「人类打字速度瓶颈问题」,重新定了的生产力的限制。
这迫使我们在通过AGI的道路上,除了考虑打造更强的模型之外,还要考虑人类能力瓶颈(输入速度)这一隐形障碍,也推动我们重新审视人机关系。
比如,有网友提出,在AI编码场景中,如果把审查、判断、设计(通常需要人类完成)前置,然后再让AI编码,就可以成倍提高开发速度。

AGI的实现,是为了解放人类,但这里的一个悖论是:
在AGI到来之前,需要先把人类从审查AI的工作中解放出来。
Embiricos表示,想要突破「人类打字速度瓶颈问题」,必须让AI智能体能够自己审查工作、而不再依赖人类:
「你可以让一个智能体盯着你正在做的所有事情,但如果这个智能体不能同时验证它自己的工作,那你依然会被卡住。」
所以,问题最终又回到了人类自身:
你是否真的有精力去审查那么多代码?
在Embiricos看来,解决之道就在于让AI能够自动审查自己的工作,将人类从编写提示词和验证AI输出的工作中解放出来,这样就不会受制于人类的速度。

「如果我们能够重新构建系统,让智能体在默认状态下就足够有用,我们就会开始解锁那种『曲棍球杆式』的增长」。
当AI的自动化能力足够强大,就可能实现Embiricos所说的那种「曲棍球杆式增长」:前期几乎平坦,随后突然陡然上升,形状看起来就像一根曲棍球杆。

Embiricos认为,要实现完全自动化的工作流程并不存在一条放之四海而皆准的简单路径,每一种使用场景都需要单独设计。
但他预计,朝着这种爆发式增长迈进的进展很快就会出现。
「从明年开始,我们会看到一批早期采用者的生产力率先出现曲棍球杆式提升;而在接下来的几年里,会有越来越多的大公司也实现类似的生产力飞跃」。
Embiricos表示,到了2026年,随着最早一批采用者率先实现曲棍球杆式的效率提升,以及未来几年越来越多的大公司也实现类似的生产力飞跃,我们也将迎来AGI。
「这种曲棍球杆式的增长最终会反哺到AI实验室,而到时我们基本上就已经站在 AGI的门槛上了」。
沿着Embiricos的思路,可以得出这样的结论:
通往AGI的一个真正突破点,在于打破人机协作的制约,让AI智能体能够自主工作,而不再依赖人类的时候。
就像谷歌DeepMind创始人哈萨比斯(Demis Hassabis)所言,在更具自主性和代理能力的系统到来之前,仍需要人机协作作为过渡形态。
他认为AI需要磨练自身的推理能力、自主性与创造力,在这方面目前仍有一些缺失。
「机器要掌握人类所能做的一切,可能还需要五到十年时间」,这也是他对AGI时间表的判断。
参考资料:
https://www.businessinsider.com/openai-artificial-general-intelligence-bottleneck-human-typing-speed-2025-12
文章来自于“新智元”,作者 “元宇”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0