这两天,字节跳动开源了一个 Agent 产品,直接炸了。
名字叫 DeerFlow。
登上了 GitHub Trending,截至目前已经拿下了近 4 万 Star。这个成绩含金量很高,能到这个数字的中国开源项目,真的不多。各个社区、各种群都在讨论这个东西。

准确点说,DeerFlow 是一个开源的 super agent harness,直白讲就是一个拿来就能用、还能随意扩展的超级 Agent。它把子智能体、记忆、沙箱这些东西组织在一起,再配合可扩展的技能模块,拼成了一整套 Agent 系统。
但我发现很多朋友私信说不太会弄。毕竟这是个 GitHub 上的开源项目,看上去门槛挺高的。
所以我专门高强度玩了两天,整理了一份从入门部署到精通的教程。跟我一步一步来就行。
先说清楚它为什么火。
原因很直接:开源,免费。
我们已经在网上见过一堆 Agent 产品了,Kimi Agent、MiniMax Agent、Manus…… 这些基本都要高额付费。而 DeerFlow 完全免费,你只要接一个 API 就能用,所有数据都存在你的本地,所有内容你完全可以自己去养成。
这一点真的太爽了 😎
它能干的事挺多的,深度研究、代码编写、文件生成、PPT、播客、生图生视频。最核心的能力是它可以把一个复杂任务拆成好几个子 Agent 同时跑,而且它有长期记忆,你跟它聊过的东西它能记住。

使用场景也很广,市场调研、数据分析、内容生成、代码开发、自动化流程,都能覆盖:

OK,话不多说,直接上教程。
DeerFlow 的 GitHub 链接为:
https://github.com/bytedance/deer-flow
下载方式,我用的是 Claude Code。
我这个账号以后所有下载开源项目的方式,全部都是 Claude Code,不用问为什么。
Claude Code 已经是我与这个世界对话的唯一窗口了。
它实在太方便了,能自动帮你解决掉非常多麻烦。直接输入一句话:

Claude Code 就会自动帮你把整个项目装好,什么都不需要管。
安装完成后,它会给你一个本地地址,类似 http://localhost:xxxx。
复制到浏览器里,就能看到这个页面:

看到这个页面,就说明你已经安装成功了。整个流程真的非常简单 😊
如果你嫌每次都要复制地址太麻烦,可以让 Claude Code 帮你做一个本地小应用,双击就能打开。直接跟它说「帮我做一个一键双击就能打开 DeerFlow 的应用」就行。
本地化的 DeerFlow 长这样,双击就能用:

接下来这一步最容易踩坑——接 AI 大模型。
DeerFlow 只是一个 Agent 的框架,里面所有的 AI 服务都得你自己往里添加。你需要一个 API,可以去各家 AI 厂商官网买,也可以去淘宝上找 API 中转站,都行。
但经过我大量踩坑,有一件事必须提前说清楚:
模型,千万别图便宜。
模型太差的时候,整个 Agent 的效率会直接崩掉,甚至完全用不了。比如我一开始图便宜,用的 DeepSeek V3.2,各种报错。
反复测试之后,我比较推荐的模型是:Kimi 2.5、MiniMax、GLM 5、Claude Sonnet 4.6。
不同模型在这个 Agent 上的表现差异非常大。便宜模型最严重的情况是完全生成不了内容,轻一点的就是做出来的东西质量很差。后面你会看到具体对比。
怎么把 API 接进去?还是一句话,跟 Claude Code 说:
DeerFlow 的 AI 大模型用这个,API 为:xxxx,地址为:xxxx
它会自动帮你配置好。
安装完了,API 也接好了,下面看看 DeerFlow 到底能干什么。
进入主页面,我用的模型是 Claude Sonnet 4.6。有个重要的细节——文本输入框下面有个「Ultra」开关,做复杂任务的时候一定要把它开上,它才会调用子 Agent 的能力。

DeerFlow 里面已经内置了不少 skill,网络搜索、数据分析、PPT 这些直接就能用。不过如果你想生图或者生视频,还得额外接对应的 API。
下面我做了几个实测,基本能说清楚它的核心能力。
我让它同时调研三个领域:① 2026 年 AI 芯片市场 ② 云计算市场 ③ 端侧 AI 市场,分别总结现状和趋势,最后汇总对比。
三个子 Agent 同时并行执行,各自搜索、各自分析:

一开始用 DeepSeek V3.2 做的。结果做出来的东西完全没法看——它写了一个 txt 文本,直接把后缀改成了 docx,我连文件都打不开 😅

换成 Claude 以后,整个工作流立刻顺了。做了一份大概 1300 字的研究报告,结构还算清晰。量确实偏短,但这个可以后续微调。

后来我又让它做了一个《OpenClaw 在中国火爆现象深度研究报告》,一开始搜索质量和内容都比较一般:

原因在于 DeerFlow 后台有几个参数是固定的——网络搜索最大只有 5 条,到一定字符数就自动截断,模型单次最大输出也被限制住了:

这就体现了开源的好处。你可以随意 DIY。跟 Claude Code 说一句,把搜索条数、输出长度这些参数全调高就行。当然也得考虑 API 消耗——设太高了,token 一下就跑干了。
一句话:只要你钱包够,这玩意的上限很高 💰
DeerFlow 支持生成饼图、条形图之类的可视化内容,不需要你怎么配置,直接就能做出还算不错的图表。所有可视化都以图片形式嵌入到报告里,你可以下载 MD 文档,也可以单独下载图片。
因为它是 Agent,可以自主搜索。比如让它帮你下载泰坦尼克号的数据集,它会自己去网上搜数据集、下载到本地、再进行分析:

条形图也能做:

所有内容存入后台的数据分析报告文件夹,直接去找就行:

代码编写是最基础的操作了,重点说说 PPT。DeerFlow 内置了做 PPT 的 skill,原理是用 Python 的 PPTX 库来写代码生成。
我让它根据之前那份 AI 芯片与云计算趋势研究报告做一份 PPT:

一开始拿 GPT-4o 做的,整体完全不行。框架没问题,但模型能力确实撑不起来:

换成 Claude Sonnet 4.6 以后,效果明显好了很多。不过整体还是偏简单,有些排版元素超出了范围,比如左上角和右下角的样式都跑偏了:

后来我让它做可视化的 PPT,因为图表直接编码就行,不太需要理解复杂的排版逻辑,效果就好了不少:

DeerFlow 支持生成播客,你得接一个 TTS(文本转语音)模型。选择很多,MiniMax 的、GPT 的、字节自己的都有。
我用的是 GPT 4O Mini TTS:

在 DeerFlow 里做播客,流程确实顺。因为跑在本地,用的都是你自己的资源,速度很快。
随便粘贴一段内容给它,它会直接调用本地技能去写脚本:

脚本写得很详细:

把 TTS 的 API 给它之后,立刻就开始生成音频。最后的 MP3 没有问题,质量基本取决于你用的 TTS 模型好不好。MP3 和 Markdown 都支持下载。
我听了一下,效果还不错,至少说明这个工作流是完全跑通了 ✅

DeerFlow 也支持这两个功能。因为有子 Agent 的能力,你可以让它并行生成大量图片,这跟 Kimi Agent、MiniMax Agent 的能力差不多。
它生成图片之前会自己先写 prompt。我让它生成 12 张图,它会先为每张图各写一个提示词,全部写完以后再逐张生成,最后一次性交付给你:

不过这里踩了一个坑:

我用的是 API 中转站走的豆包 Seedream 5.0 模型,挺便宜的。但走中转站的话,它会往图片里加 AIGC 水印,导致 DeerFlow 做出来的图片没法正常显示。
解决方式很简单,跟 Claude Code 说一句,它会自动帮你把那些垃圾字节剥掉:

所有图片都支持下载到本地:


图片质量上,80% 取决于你接的图片生成模型,20% 取决于 Agent 框架写的 prompt。作为一个开源 Agent 产品,这个表现已经挺不错了:

它也支持生成 PDF,比如把所有图片都转到一份 PDF 里:

除了上面这些,DeerFlow 还有几个东西值得单独说说。
DeerFlow 会在后台偷偷从你的对话里学东西,然后记到你的用户档案里。
说直白点,它会慢慢理解你关注的领域和使用习惯,在一些细节上给你更个性化的回应。我目前用的时间短,还没特别明显地感觉到差异,但这个机制确实是实打实跑着的 😆。

它的记忆里分了很多类别,每个类别还会标注一个「置信度」——对这条记忆的可信程度有多高。来源也可以直接查看,定位到你之前的具体对话:

DeerFlow 内置了不少 skill,但都比较基础。重点是它支持你新建技能——之前给 OpenClaw 或者 Claude Code 下载的 skill,全部都可以导入进来,打通了,没有任何问题。

它还支持创建带有专属 prompt 的自定义智能体。这个功能现在很多 Agent 产品里都有了,比如 MiniMax Agent 里叫「专家智能体」,前面会有一段很长的前置提示词。
DeerFlow 也支持这个,你自己填 prompt,就能做出一个专属的智能体:

最后说几个需要避的坑。
第一,一定要搭配 Claude Code 用。
DeerFlow 是个本地项目,它没有任何错误提示。我用的过程中碰到过很多 API 接入的问题——它不会告诉你「你的 API 出问题了」,直接就断了。你在界面上跟它对话,它突然没反应了,你根本不知道是哪出的错。
如果没有代码基础,要去后台的各种 json 和 config 文件里排查问题,那真的太痛苦了。
所以最好的方式就是用 Claude Code 来安装、配置、排障。遇到什么问题,直接跟它说,它会帮你搞定一切。这也是为什么我前面说 Claude Code 是唯一的窗口,因为我们现在真的已经到了用智能体去操作智能体的阶段了。
第二,模型千万别图便宜。
前面已经说了很多次了,但真的太重要了。
当 Agent 的框架已经搭好了,工作流也做得很复杂了,你塞一个差模型进去,框架的能力完全发挥不出来,稍微复杂点的任务直接就跑不动。
DeerFlow 在 readme 里推荐了 Kimi 2.5、豆包的模型。但从我个人体验来看,最好用各家厂商当前最强的模型:智谱 GLM 5、Kimi 2.5、MiniMax,还有我一直在用的 Claude Sonnet 4.6。Claude 会贵一点,但它给你的体验确实是最好的。字节自己的豆包模型,我觉得一般 😭,不推荐。
拉回来说说我的整体感受。
玩了两天下来,我觉得 DeerFlow 确实够格火成这样。该有的东西它都做进去了,子 Agent 能并行跑,有记忆,能装技能,还有沙箱。
但它的天花板和地板,几乎完全取决于你接的模型。
框架好 + 模型强 = 真正能用的 Agent。
框架好 + 模型差 = 一堆报错和垃圾输出。
不过,这仍然是目前几乎最好的 Agent 开源项目,甚至没有之一。
任你随意 DIY,不过,这肯定没有 Manus 那样完善的功能模块,不过,都免费用了,我还能说啥呢。
文章来自于“AI Humanist by杉森楠”,作者 “杉森楠”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales