Codex撞脸Claude Code,新功能只领先11天

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Codex撞脸Claude Code,新功能只领先11天
8146点击    2026-06-07 10:54

Codex和Claude Code长得越来越像了!


最近,开发者Elie Bakouch感到Claude Code和Codex的功能越来越像,他好奇到底哪家在领跑,于是就把两家都有的功能做成了一张时间线。


Codex撞脸Claude Code,新功能只领先11天


这个时间线跨度从2025年2月到2026年6月,将Claude Code与Codex的相似功能时间顺序排列,其中橙色代表Claude Code,蓝色代表Codex。


每一行是一个双方都拥有或相近的功能,涵盖了从/goal、子智能体(subagents)到OpenAI最近推出的「dreaming」记忆机制等更新。


Codex撞脸Claude Code,新功能只领先11天


Elie统计的结果是:两家共有24项相似功能,其中18项是Claude Code先发布的,Codex只先发了4项,剩下2项谁先谁后还有争议。


单看两家共有的功能,Claude Code更像那个引领节奏的人:18项功能抢先发布,橙色几乎铺满了整张时间线的前半段。而Codex抢先发布的只有4项。


两家的圆点贴得越来越近,一项新功能的先发优势,正在以天为单位蒸发。


Codex先发那4项里,有2项被Claude Code几乎贴身扳了回来:/goal是Codex先上,11天后Claude Code追平;多智能体并行,又是Codex先发,Claude Code用了11天追上。两次反扑,都没超过两周。


相比之下,Codex这边接下来要啃下的那条清单更长。


你追我赶之中,双方撞车的还不只是时间,连斜杠命令的名字、技能文件的格式,也都开始重合。


两家AI编程智能体,正在逐渐长成同一张面孔。


18比4


Claude Code赢在了起跑线


Elie整理的这份清单,覆盖了Claude Code和Codex从发布到现在的24项共同功能。


这是他个人整理,交叉了npm发布时间、GitHub release和官方博客,并没逐条与官方核对,但大趋势是清晰的。


Claude Code比OpenAI新版Codex早约80天推出。它2025年2月先以终端里的编程智能体形态亮相,Codex要到5月才以云端软件工程智能体的形式发布。


正是这早出发的约80天,加上之后一年里紧凑的更新节奏,让Claude Code在24项里先发了18项,橙色铺满了前半张表。


这些功能包括无界面脚本化(headless)、模型上下文协议(MCP)、自定义斜杠命令(custom slash commands)、上下文压缩(context compaction)、子智能体(subagents)、生命周期钩子(hooks)、技能(skills)等。


作为后发者,Codex也不是一直在追。内置沙箱(built-in sandboxing)、云端异步智能体(cloud async agent)、多智能体并行团队(multi-agent teams)、目标模式(Goal mode),这几项都是Codex先发。


还有两项,Elie标为有争议。


检查点与回滚(checkpoints/rewind),如果按「能撤销代码改动」这个更强定义看,Claude Code的 /rewind更接近完整检查点回滚;如果按「会话回退/分叉」看,Codex侧也有较早记录,所以这一项仍应保留为争议项。


记忆dreaming(memory dreaming)的争议,是它把两件事搅在了一起。如果只看「记忆」能力,OpenAI侧更早在ChatGPT memory体系中推进;但如果看「dreaming」这个名称和回看历史、自我复盘机制,Anthropic在Claude Managed Agents中于2026年5月6日公开推出。


撇开这两项,18比4,Claude Code的领跑优势,肉眼可见。


Codex撞脸Claude Code,新功能只领先11天


其实,「Codex」这名字不是2025年才有的。


OpenAI早在2021年就发过Codex模型,用自然语言生成代码。但Elie比的是2025年才上线的Codex编程智能体。


OpenAI明明在AI编程上起了个大早,却把编程Agent的先发优势让给了Claude Code。


旧Codex证明了「模型会写代码」,Claude Code则率先把这件事做成了开发者愿意日常使用的智能体产品。


功能像素级对齐


是抄袭,还是收敛?


这场贴身肉搏里,两家的功能正贴着脸往一块儿长,已经不是单点撞车,而是关键能力成组对齐。


最典型的就是/goal。


Claude Code官方文档里,/goal是这么定义的:给它设一个完成条件,它会跨多个回合一直干,直到条件满足才停。每跑完一回合,一个小而快的模型判断条件成立没有,不成立就继续下一回合,而不是把控制权还给用户。


Codex撞脸Claude Code,新功能只领先11天


Claude Code官方文档中 /goal 的定义:设好完成条件,每跑完一回合由一个小而快的模型判断是否达成,未达成就继续。


Codex的Goal mode做的也是同一件事:给定一个持久目标,Codex就朝着它一轮轮干下去,几小时、甚至几天都不用人盯。这功能也早过了实验阶段,app、IDE插件、命令行里都能调用。


同一套机制,两家各做了一份。


subagents也是。


Claude Code的子智能体跑在各自独立的上下文窗口里,用来隔离上下文、约束工具、复用配置、压成本;Codex则靠并行的专用智能体(specialized agents)跑subagent工作流,再汇总结果。


更微妙的是,连名字都对上了。Codex给侧边提问命令加的/btw别名,直接和Claude Code撞名;技能系统那边,Claude Code与Codex也都采用了Anthropic的SKILL.md格式。


Codex撞脸Claude Code,新功能只领先11天


Claude Code与Codex的技能均采用Anthropic发起、后开放为标准的SKILL.md格式,连文件名都一致。


把两家的文档对比细看,你会发现:这不是谁照搬谁的故事,是AI编程智能体这个产品,本身就在收敛成一个固定形态。长任务、子智能体、上下文压缩、权限沙箱、工作区隔离、插件和技能生态,无论谁做,最后都可能会长成这个样子。


Dreaming这一项更典型。


Anthropic给Claude Managed Agents(Claude托管智能体)做了个叫dreaming的机制,能回看历史会话、找规律、自我改进;OpenAI六月初也给ChatGPT上了同名的dreaming记忆系统。


Codex撞脸Claude Code,新功能只领先11天


可这两个dreaming并不是同一个东西:Anthropic的Dreaming长在托管智能体平台,不是Claude Code命令行里人人能敲的命令;OpenAI的Dreaming则长在ChatGPT的记忆系统里,也不是Codex的编程能力。


真正值得注意的是:AI Agent的产品语言、能力模块和接口形式,正在越来越快地向同一套范式靠拢。


这意味着,功能清单本身已经不再是壁垒。真正的差距,从「有没有这个功能」,升级到了「这个功能到底做成什么样」。


先发抢热度


赢到最后却看可靠性


在AI这个快速迭代的领域,先发到底还值不值钱?


据WIRED报道,2025年9月,Codex的使用量只有Claude Code的5%。到2026年1月,这个数字蹿到了接近40%:追赶的速度很快。


用户数也在拉近。OpenAI在6月2日称,Codex周活跃用户已超过500万,较2月桌面版上线时增长约6倍。Anthropic不单独公布Claude Code的周活,第三方估算其5月在200万量级。


两者口径也不完全对齐:Codex这500万里非开发者已占两成,是把「编程工具」摊成「办公平台」后的数字。


在更纯粹的开发者侧,Claude Code仍占上风:过去30天npm下载量约4630万次,是Codex命令行版(约1400万次)的3倍多(第三方统计)。论「每周多少人打开」,Codex已经反超;论「开发者用得有多重」,Claude Code仍领先。


值得Anthropic警惕的,是一些开发者的「倒戈」。


WIRED援引Notion联合创始人Simon Last的说法,他和核心工程师在GPT-5.2前后转向了Codex,理由是可靠性。他说Claude Code会对他撒谎,「说自己在干活,其实根本没动」。


去年10月,OpenClaw之父Peter Steinberger公开宣布整套工具都用Codex搭成,四个月后,他本人也加入了OpenAI。


Codex撞脸Claude Code,新功能只领先11天


Peter Steinberger 自述已完全转用 Codex CLI 作为日常主力,常在 3x3 终端网格里并行跑3到8个实例。https://steipete.me/posts/just-talk-to-it


当先发红利一天天被摊薄,真正的胜负手早已不在「谁先做出来」。


差异化窗口正在关闭


双方的功能清单一旦趋同,较量的战场就变成了这些功能的体验上。


早期比的是谁更会写代码、改bug、读代码仓库。现在比的是一整套工程环境:记忆、计划、沙箱、工具调用、子智能体、后台任务、远程控制、长期目标。


同一个功能,谁的响应更快、长任务完成率更高、自动压缩更干净、权限更安全、成本更低。


双方对AI编程的理解和路数也不一样。


Claude Code更像「终端里的自主工程师」,先在命令行里把开发者工作流吃深,再用hooks、子智能体、技能、插件往外长。


Codex更像「多端工作台」,把命令行、IDE、桌面App、移动端远程控制和云端任务揉成一体。


虽然打法不同,两者的目标却撞在了一起:都不甘心只当IDE里的一个插件,都想成为开发者每天打开的第一个入口,成为个人和企业的操作系统。


Elie甩出那张表,本想给两家分个高下,结果反而揭开了另一个事实:AI编程智能体的差异化窗口,正在迅速关闭。双方越追越紧,也越长越像。


参考资料:


https://x.com/eliebakouch/status/2062693979087397189?s=20%20


https://x.com/MTSlive/status/2062569780947849398%20


https://openai.com/index/chatgpt-memory-dreaming/%20


https://gist.github.com/eliebak/e1f30ab973ee3ef41cba275d65c3b2cb


文章来自于微信公众号 "新智元",作者 "新智元"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md