2小时17分钟,这是截至2025年8月,前沿AI模型在保持50%成功率的前提下,能够维持连续推理工作的时长。这个数字意味着AI已经从处理“秒级”的代码片段,跨越到了处理“小时级”的复杂工程任务。

基于此背景,OpenAI针对其编程工具Codex发布了一份基础却至关重要的指南:《Building an AI-native engineering team》构建AI原生工程团队。

这份文档不光是为了展示GPT5.1,更多是为了教用户怎么用。它最大的亮点在于为软件开发的每一个阶段(规划、设计、构建、测试、部署)都提供了一份拿来即用的“实战启动清单 (Getting started checklist)”。
本文将结合这些清单,精读这份Codex使用手册,带您了解如何从零开始构建一个“委托 (Delegate) - 审查 (Review) - 拥有 (Own)”的AI原生工作流。
在传统的开发模式中,工程师的大部分时间消耗在“翻译”工作上,即将需求翻译成代码,将设计翻译成组件。而在AI原生团队中,这种模式被一个新的循环所取代:
这并不是要取代工程师,而是将他们从繁琐的实现细节中释放出来,专注于更高维度的系统推理。
在项目启动阶段,最大的摩擦力往往来自“未知”。工程师需要花费数天时间挖掘代码库,才能确定一个新功能是否可行,或者涉及哪些服务。
AI智能体现在可以介入规划阶段,通过读取功能规格说明书并将其与现有代码库进行交叉引用。它们能瞬间追踪代码路径,列出受影响的服务列表,并在写一行代码之前标记出规格说明书中的歧义。
设计阶段常被基础设置工作(Boilerplate)拖慢。智能体通过多模态能力,彻底改变了这一现状。工程师可以直接将设计稿截图喂给AI,智能体能瞬间生成符合团队设计系统(Design System)的组件代码。
启动清单 (Actionable Checklist)


构建阶段是工程师痛感最强的地方,也是AI智能体影响最深远的领域。
在大型单体仓库(Monorepo)中,工程师往往花费大量时间在“寻找正确的做事方式”上。AI智能体不仅是代码生成器,更是“第一手实施者 (First-pass Implementer)”。
现在的Agent能够在一次长时间运行的任务中,跨越数十个文件,处理数据模型、API、UI组件、测试和文档。如果遇到构建错误,它们会像人类工程师一样,根据错误信息调整代码,直到构建成功。
当AI处理了CRUD逻辑、样板代码和基础连线后,工程师的注意力转移到了Review (审查)和Own (拥有)上,评估架构影响,定义新的抽象,以及处理模糊的产品需求。
启动清单 (Actionable Checklist)

PLAN.md 文件并提交到代码库中,作为它执行任务的路线图。感兴趣您可以参考下:
AGENTS.md 文件中迭代指令,解锁Agent运行测试和Linter的能力,让它能接收反馈并自我修正。在许多团队中,测试覆盖率往往是截止日期压力下的牺牲品。AI原生团队通过反转这一流程来解决问题。
随着AI接管代码实现,测试变得比以往任何时候都重要,它们成为了应用功能的真理来源 (Source of Truth)。AI擅长阅读需求文档并生成测试用例,特别是那些人类容易忽略的边缘情况(Edge Cases)。
代码审查(Code Review)通常在“耗时深究”和“草草了事”之间两难。AI审查不同于传统的Lint工具,它能理解运行时行为,跨文件追踪逻辑。但文档强调,必须使用专门针对代码审查训练的模型,避免通用模型的“噪音”。
启动清单 (Actionable Checklist)

AGENTS.md 文件中明确设定测试覆盖率的标准。文档最怕“过期”。AI原生团队将文档生成嵌入到了发布流水线中。Agent可以读取代码并生成Mermaid格式的架构图、API文档,甚至在Release过程中自动分析Commit历史生成变更摘要。
故障排查通常需要在日志工具、代码仓库和部署系统之间反复横跳。通过MCP (Model Context Protocol),AI智能体可以连接到日志聚合器(如Databricks, Azure DevOps),在IDE中直接分析错误日志并关联到Git历史中的具体变更。
启动清单 (Actionable Checklist)


要实现上述愿景,OpenAI提出了两个关键的技术,这相当于为AI团队构建了“基础设施”。
AGENTS.md:AI的员工手册就像新员工入职需要阅读手册一样,AI智能体也需要指导。OpenAI建议在使用codex时,最好在代码库根目录维护一个 AGENTS.md 文件。
MCP是连接AI模型与外部世界的标准协议。
OpenAI的这份指南向我们展示了软件工程的未来图景:工程师并不会消失,但“什么是工程”的定义正在被改写。
以前,工程能力的衡量标准可能是你写代码的速度、对语法糖的熟练度。 现在,工程能力取决于你分解问题的能力、设计系统架构的眼光,以及指挥AI智能体群协同工作的领导力。
正如文档结尾所言:这种转变不需要激进的推倒重来,而是通过一个个具体的workflow开始的。从今天开始,在你的仓库里建一个 AGENTS.md,试着按照上述清单将第一个Issue分类任务委托给AI,你就是在构建未来的AI原生工程团队。
文章来自于“AI修猫Prompt”,作者 “AI修猫Prompt”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0