AI 编程工具的进步速度正在迅速加快。
如果各位读者从事涉及代码相关的工作,应该很能察觉到近两年 AI 编程能力的进化幅度,GPT-5 和 Gemini 2.5 等最新前沿大模型已经让开发者在实际任务中一定程度实现了自动化,近期发布的 Sonnet 4.5 又再次推动了这一进展。
再结合现在已经非常成熟 CLI、IDE 工具等的辅助,采用编码智能体进行开发工作已经成为了一种常态,甚至成为了一种新的生活方式。
不仅仅是程序员,产品类、设计类岗位的从业人员都已广泛采用 AI 编码智能体辅助工作,AI 生成的代码比例越来越高。
但是,AI 编码智能体仍然存在一些问题,比如代码质量不高,智能体分析效率低下等等。
那么,与其等待智能体分析生成或是多次「抽卡」的低效,有没有可能同时并行使用多个智能体进行工作呢?
Datasette 的创建者,独立开源开发者 Simon Willison 已经成为了同时使用多个编码智能体的开发者。
为此,他发布了一篇全新博客,分享了自己同时运行多个编码 AI 的经历和宝贵经验,引起了海外开发者们广泛的关注,在 X 上的推文已破 10 万阅读量。
Simon Willison 起初对此是持怀疑态度的。AI 生成的代码必须经过审查,而审查速度天然是瓶颈。光是跟上单个大模型的产出速度就已经很吃力了,如果同时运行多个代理,只会更加落后,那又有什么好处呢?
尽管一开始有顾虑,但过去几周他发现自己其实已经悄然接受了这种「并行编码代理」的工作方式。
在工作中,他发现可以并行启动越来越多的小任务,而不会给主要工作增加太多认知负担。
以下是 Simon Willison 总结的一些高效使用并行代理的模式:
概念验证研究任务
第一个适合并行代理的任务类别是研究。
研究任务用于回答问题或提供建议,而不会直接修改你计划保留的项目代码。
许多软件项目都始于概念验证阶段。例如:能否用 Yjs 和 Python 后端实现一个简单的协作笔记工具?这些库虽然存在,但它们能否顺利协同工作?
如今的编码代理已经能够用新库快速构建原型,验证这些基础性问题。即便新库不在模型的训练数据中也没关系 —— 直接让代理去克隆这些依赖的仓库、阅读代码、自己摸索使用方法。
系统机制回溯
当你需要回忆系统中某一部分的工作原理时,现代的「推理型」大模型能在一两分钟内给出详细且可操作的答案。
无论代码库多大,代理都可以借助诸如 grep 之类的工具,在数十个文件之间追踪调用路径。
你可以让它:
这些由 LLM 生成的解释非常值得保存起来 —— 它们可以作为后续 prompt 的上下文材料,非常有价值。
小型维护任务
接下来是真正打算保留的代码修改,尽管它们风险较低。事实证明,有许多小问题只需一点额外的「脑力负担」,这些完全可以交给代理处理。
例如警告信息(warnings):如果测试套件抛出某个弃用(deprecated)警告,把它丢给一个代理,让它运行测试、找到并修复问题。你无需中断正在进行的主要任务来解决这种小烦恼。
发现这种机会是一种能力。最好的练习方式就是多尝试 —— 任何小的维护任务都值得交给代理试一试。无论成功或失败,你都能从中学到东西。
精确指定的实际工作
审查一段「从天而降」的代码改动是很费力的。
首先得推测作者的意图:它要解决什么问题?这个问题是否值得解决?方案是否合理、能否与后续计划兼容?这些都需要思考大量高层问题,才能开始看具体实现。
但如果代码是根据你自己写的详细规格说明生成的,那么审查负担就轻得多。当你已经确定了目标、方法和实现细节,只需要验证代理产出的代码是否符合你的要求即可。
现在的使用方式
目前,Willison 的主力工具是:
此外,还在尝试:
他仍在摸索最适合自己的工作模式,预计还会持续调整。
他经常同时打开多个终端窗口,在不同目录中运行不同的代理实例(通常是 Claude Code 与 Codex CLI 的组合),以 YOLO 模式(无需批准)执行那些安全性可控的任务。
对于风险较高的任务,主要使用异步代理(通常是 Codex Cloud)。这样即便出问题,最糟糕的情况只是源码泄露。
他偶尔也会使用 GitHub Codespaces 来运行 VS Code 的 agent 模式 —— 它出乎意料地高效,且完全在浏览器中运行。这在 workshop 或演示场景中特别好用:只要有 GitHub 账号即可使用,无需额外的 API 密钥。
这篇博客一经发布就受到广泛关注,非常契合现在代码相关开发工作的痛点。越来越多人正在尝试同时使用多个编码智能体进行开发工作。
Google Labs 的产品总监 Kath Korevec 有 80% 左右的编码工作是由 AI 辅助完成的,她同样表达了对并行智能体工作流的热情。
还有一些开发者分享了自己关于并行智能体开发范式的理解:
当然,很多开发者表达了一些担忧的声音,尤其是关于智能体生成代码产生的不可控因素:
更多开发者讨论,可以关注原推文:
https://x.com/simonw/status/1974835974938206222
文章来自于微信公众号 “机器之心”,作者 “机器之心”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0