
你可能遇到过这样的场景:开发一个购物车重构功能,涉及数据校验、优惠叠加、订单拆分等多个逻辑。
你把需求交给 Coding Agent,它没处理完就停止了,需要你继续对话完成这个任务。
就这样反复停止、继续对话。
到了第 8 次,它已经忘记你在任务开始时,告诉他的“一个类只做一件事”的开发原则。
问题出在哪?这其实是当前 Coding Agent 的通病:
1. 一次任务给的 token 给的不够,难以处理复杂任务,只能拆分成多个独立请求;
2. 处理多个任务时,跨步骤的逻辑关联容易丢失,无法在长对话中保持上下文连贯性;
3. 执行模式偏黑盒,只返回结果,不主动同步进度或暴露决策过程。
针对这类复杂编程任务场景,字节 TRAE,推出了 SOLO 模式,想要解决上述这类复杂问题。
SOLO 模式 7 月份在 TRAE 海外版上线了内测版本;11 月 12 日,SOLO 在 TRAE 海外版全面开放;11 月 25 日,SOLO 模式正式登陆 TRAE 国内版,而且完全免费使用。

TRAE 国内版 SOLO 模式目前可以完全免费使用,支持约 10 万个文件大规模代码库检索,对于大部分个人项目,甚至公司内部的单体仓库,都在它的能力覆盖范围之内。
官方称它为“The Responsive Coding Agent”:一个能实时反馈进度、支持随时干预、可以并行推进多个任务的编程智能体。
简单说就是三句话:看得见(实时进度)、管得住(随时叫停)、跑得快(多任务并行)。
具体包括三个层面的体验增强:
让用户实时可感知。AI 会通过智能摘要、To-Do List、开发计划等形式主动汇报进度,你不用逐行翻对话,就能知道现在做到哪一步。
让用户随时可掌控。Plan 模式让 AI 在动手前先给出方案,DiffView 则集中展示所有代码变更,方便你像做 Code Review 一样逐条过一遍。
引入了多任务并行机制。新增的多任务列表支持多个开发任务并行推进,且互不影响,大大增加了项目的开发效率。
此外,SOLO 模式内部集成了 SOLO Coder。
什么是 SOLO Coder 呢?
简单来说,它是 SOLO 模式下的内置智能体,可以智能调度多个专业 Agent,是一个具备「计划-执行-监控-审查」完整闭环能力的开发智能体。

从技术视角看,SOLO Coder 用四个机制,解决了 AI 处理复杂任务和反馈不及时的问题:
执行前方案评审:Plan
启用 Plan Mode 后,系统会先输出结构化的开发计划,而非直接生成代码。
你可以直接点击执行来通过方案,也可以回复“不行”拒绝或“不行,Redis 缓存策略要改成 LRU”调整方案。
这种机制可以降低 Agent 误操作风险,例如可以防止 Agent 误删你的文件(参考前段时间的新闻:Gemini3 删除了用户 800 个 G 的文件,把用户的 AI Coding 工具和资料都删了)。

专业的事交给专业 Agent:Sub Agent 智能调度
面对「为 SaaS 产品新增多租户权限系统」这类较复杂的编程任务,SOLO Coder 可以将任务拆解,并交给不同的专业 Agent 解决对应问题,例如,主 Agent 可以调用数据库架构 Agent 设计表结构,再调用后端开发 Agent 实现 RBAC 逻辑、调用前端开发 Agent 搭建权限管理界面。

通过引入子 Agent,可以在复杂项目中提升 AI 输出效果。
主 Agent(如 SOLO Coder)通常是执行和处理较复杂任务的,在上下文较长时,会容易出现执行具体任务不准的情况。通过引入 Sub Agent,则可以更清晰地拆分和隔离各种精细化的任务,让专业的 Agent 做专业的事,Sub Agent 工作时的上下文是隔离的,也会减少上下文污染的问题。
此外,目前大多数 Coding Agent 只能人为调度各种 Agent 工作,SOLO 模式通过引入子 Agent,其智能化和自动化程度更强。

改了什么一目了然:DiffView 代码审查
系统会保留最近若干次会话的变更记录,你可以在对话末尾点开「查看变更」,一次性审查多个文件的修改;如果对某一步的改动不放心,也能只看那一步对应的 diff,精准追踪问题来源。

长对话不跑偏:上下文管理
SOLO 支持自动与手动两种压缩方式:当上下文逼近窗口上限或切换 Agent 时,系统会自动触发压缩;在对话内容占用较多窗口时,开发者也可以手动按下 Compact 进行压缩。
压缩策略是尽量丢弃冗余细节,保留关键信息,让模型在长对话中不跑偏。
把这四个能力串起来,你会得到一套新的协作模式:
第一步,用 Plan 模式让 AI 事前沟通。重点看它有没有考虑边界情况:异常处理完整吗?并发场景会不会死锁?事务边界划对了吗?如果方案有漏洞,现在拒绝比事后 debug 成本低得多。
第二步,让 AI 先写测试用例。告诉它“先写 3 个正常场景 + 2 个异常场景的测试”,再让它实现功能。如果它测试用例写得清楚,说明它真的理解了这次需求。
第三步,用 DiffView 保证代码的质量。你可以检查是否引入了新的外部依赖、是否改动了不该修改的文件、变更范围是否合理。
第四步,让 SOLO Coder 完成整个流程的闭环。你只需要耐心等待,它按照跟你沟通后的方案,完整的执行整个复杂的工程任务,然后给出你一份它的处理报告。
这个流程的核心是:让 AI 先证明自己想清楚了,再允许它开发,然后看它的开发完成的报告,复查对代码的影响。
以前文的购物车重构为例,完整流程如下:
第一步,开启 Plan 模式,让 SOLO Coder 先给出方案。它列出了数据模型调整、API 接口改造、前端组件重构三个阶段,每个阶段标注了依赖关系和风险点。你发现它计划用 Redis 做缓存,但考虑到公司 Redis 集群资源紧张,你可以在 Plan 阶段,就要求它改用本地缓存+定时同步的方案。
第二步,方案确认后,SOLO Coder 开始执行。它自动调用了后端开发者 Agent 设计 API,调用前端开发者 Agent 重构购物车组件。期间你打开 DiffView,发现它修改了一个支付相关的配置文件,这不应该在购物车模块范围内。你立即中止操作,AI 撤回了这次变更。实测中,这类越界修改的识别依然需要人工判断,DiffView 的价值在于让这类问题更容易被发现。

第三步,当对话历史积累到 200 轮时,上下文开始影响 AI 的准确性。你手动触发上下文压缩,系统保留了核心的架构决策和关键代码片段,丢弃了中间可以忽略的上下文。
整个过程中,你同时还在另一个任务窗口里处理支付模块的 bug 修复,两条线互不干扰。
这些能力带来的最直观变化是,你可以像管理开发团队一样管理 AI。
在电商平台开发中,你可以开三个任务:一个专注用户体系,一个推进订单系统,一个负责接入支付接口。
AI 会根据首次提问自动生成会话标题,你也可以改成「支付模块重构」「Redis 缓存优化」这样的标签,方便快速切换。
对比一下:以前你得在三个聊天窗口里分别问“用户表怎么改”、“订单接口报错怎么办”、“支付对接文档在哪”,每次切换都要重新交代背景。
现在三个任务并行,AI 会自己记住每条线的上下文。
这种多任务列表让任务状态一目了然:主要开发任务在后台执行时,你可以随时切到另一个任务问一个技术问题,而不会中断当前的执行链路。
在界面的呈现上,SOLO 模式的三栏布局让信息更聚焦:左侧是多任务窗口,中间是更清爽的对话流,右侧是灵活的工具面板。
对话流中的关键步骤会被折叠成摘要,To-Do List 智能拆解任务并标记完成情况,你可以快速跳到上一条、下一条消息或对话顶部和底部,在复杂执行过程中始终保持条理清晰。

随着 Coding Agent 能力的提升,编程的协作方式正在从「让 AI 辅助写代码」向「让 AI 主导代码」演变。
换句话说,你需要做的,正在从手写每一行代码,变成定义清楚项目目标、审核 AI 给出的方案、把控关键路径上的代码质量,对于程序员和 Vibe Coding 爱好者,提示词工程和 AI 协作能力正在成为新的编程门槛。
有了 SOLO 模式,你可以放心把完整模块交给它,自己只盯三个关键节点:方案评审、代码 Diff、线上验证,这种协作方式,已经接近你和一个专业技术团队的交互模式。
如果,你也对现有 Coding Agent 产品,无法解决复杂任务产生失望。
那么,下一个任务,不妨试试 TRAE SOLO 模式:
把需求完整描述给它,然后看着它自动执行,在你审核确认后,一项项划掉 To-Do List。
文章来自于微信公众号 “特工宇宙”,作者 “特工宇宙”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0