字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

10377点击 2026-03-26 12:04

这两天，字节跳动开源了一个 Agent 产品，直接炸了。

名字叫 DeerFlow。

登上了 GitHub Trending，截至目前已经拿下了近 4 万 Star。这个成绩含金量很高，能到这个数字的中国开源项目，真的不多。各个社区、各种群都在讨论这个东西。

准确点说，DeerFlow 是一个开源的 super agent harness，直白讲就是一个拿来就能用、还能随意扩展的超级 Agent。它把子智能体、记忆、沙箱这些东西组织在一起，再配合可扩展的技能模块，拼成了一整套 Agent 系统。

但我发现很多朋友私信说不太会弄。毕竟这是个 GitHub 上的开源项目，看上去门槛挺高的。

所以我专门高强度玩了两天，整理了一份从入门部署到精通的教程。跟我一步一步来就行。

先说清楚它为什么火。

原因很直接：开源，免费。

我们已经在网上见过一堆 Agent 产品了，Kimi Agent、MiniMax Agent、Manus…… 这些基本都要高额付费。而 DeerFlow 完全免费，你只要接一个 API 就能用，所有数据都存在你的本地，所有内容你完全可以自己去养成。

这一点真的太爽了 😎

它能干的事挺多的，深度研究、代码编写、文件生成、PPT、播客、生图生视频。最核心的能力是它可以把一个复杂任务拆成好几个子 Agent 同时跑，而且它有长期记忆，你跟它聊过的东西它能记住。

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

使用场景也很广，市场调研、数据分析、内容生成、代码开发、自动化流程，都能覆盖：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

OK，话不多说，直接上教程。

安装

DeerFlow 的 GitHub 链接为：

https://github.com/bytedance/deer-flow

下载方式，我用的是 Claude Code。

我这个账号以后所有下载开源项目的方式，全部都是 Claude Code，不用问为什么。

Claude Code 已经是我与这个世界对话的唯一窗口了。

它实在太方便了，能自动帮你解决掉非常多麻烦。直接输入一句话：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

Claude Code 就会自动帮你把整个项目装好，什么都不需要管。

安装完成后，它会给你一个本地地址，类似 http://localhost:xxxx。

复制到浏览器里，就能看到这个页面：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

看到这个页面，就说明你已经安装成功了。整个流程真的非常简单 😊

如果你嫌每次都要复制地址太麻烦，可以让 Claude Code 帮你做一个本地小应用，双击就能打开。直接跟它说「帮我做一个一键双击就能打开 DeerFlow 的应用」就行。

本地化的 DeerFlow 长这样，双击就能用：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

AI 大模型的 API 配置

接下来这一步最容易踩坑——接 AI 大模型。

DeerFlow 只是一个 Agent 的框架，里面所有的 AI 服务都得你自己往里添加。你需要一个 API，可以去各家 AI 厂商官网买，也可以去淘宝上找 API 中转站，都行。

但经过我大量踩坑，有一件事必须提前说清楚：

模型，千万别图便宜。

模型太差的时候，整个 Agent 的效率会直接崩掉，甚至完全用不了。比如我一开始图便宜，用的 DeepSeek V3.2，各种报错。

反复测试之后，我比较推荐的模型是：Kimi 2.5、MiniMax、GLM 5、Claude Sonnet 4.6。

不同模型在这个 Agent 上的表现差异非常大。便宜模型最严重的情况是完全生成不了内容，轻一点的就是做出来的东西质量很差。后面你会看到具体对比。

怎么把 API 接进去？还是一句话，跟 Claude Code 说：

DeerFlow 的 AI 大模型用这个，API 为：xxxx，地址为：xxxx

它会自动帮你配置好。

实际使用

安装完了，API 也接好了，下面看看 DeerFlow 到底能干什么。

进入主页面，我用的模型是 Claude Sonnet 4.6。有个重要的细节——文本输入框下面有个「Ultra」开关，做复杂任务的时候一定要把它开上，它才会调用子 Agent 的能力。

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

DeerFlow 里面已经内置了不少 skill，网络搜索、数据分析、PPT 这些直接就能用。不过如果你想生图或者生视频，还得额外接对应的 API。

下面我做了几个实测，基本能说清楚它的核心能力。

1' 多 Sub-Agent 并行

我让它同时调研三个领域：① 2026 年 AI 芯片市场 ② 云计算市场 ③ 端侧 AI 市场，分别总结现状和趋势，最后汇总对比。

三个子 Agent 同时并行执行，各自搜索、各自分析：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

一开始用 DeepSeek V3.2 做的。结果做出来的东西完全没法看——它写了一个 txt 文本，直接把后缀改成了 docx，我连文件都打不开 😅

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

换成 Claude 以后，整个工作流立刻顺了。做了一份大概 1300 字的研究报告，结构还算清晰。量确实偏短，但这个可以后续微调。

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

后来我又让它做了一个《OpenClaw 在中国火爆现象深度研究报告》，一开始搜索质量和内容都比较一般：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

原因在于 DeerFlow 后台有几个参数是固定的——网络搜索最大只有 5 条，到一定字符数就自动截断，模型单次最大输出也被限制住了：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

这就体现了开源的好处。你可以随意 DIY。跟 Claude Code 说一句，把搜索条数、输出长度这些参数全调高就行。当然也得考虑 API 消耗——设太高了，token 一下就跑干了。

一句话：只要你钱包够，这玩意的上限很高 💰

2' 可视化报告

DeerFlow 支持生成饼图、条形图之类的可视化内容，不需要你怎么配置，直接就能做出还算不错的图表。所有可视化都以图片形式嵌入到报告里，你可以下载 MD 文档，也可以单独下载图片。

因为它是 Agent，可以自主搜索。比如让它帮你下载泰坦尼克号的数据集，它会自己去网上搜数据集、下载到本地、再进行分析：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

条形图也能做：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

所有内容存入后台的数据分析报告文件夹，直接去找就行：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

3' 代码编写与 PPT 生成

代码编写是最基础的操作了，重点说说 PPT。DeerFlow 内置了做 PPT 的 skill，原理是用 Python 的 PPTX 库来写代码生成。

我让它根据之前那份 AI 芯片与云计算趋势研究报告做一份 PPT：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

一开始拿 GPT-4o 做的，整体完全不行。框架没问题，但模型能力确实撑不起来：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

换成 Claude Sonnet 4.6 以后，效果明显好了很多。不过整体还是偏简单，有些排版元素超出了范围，比如左上角和右下角的样式都跑偏了：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

后来我让它做可视化的 PPT，因为图表直接编码就行，不太需要理解复杂的排版逻辑，效果就好了不少：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

4' 播客

DeerFlow 支持生成播客，你得接一个 TTS（文本转语音）模型。选择很多，MiniMax 的、GPT 的、字节自己的都有。

我用的是 GPT 4O Mini TTS：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

在 DeerFlow 里做播客，流程确实顺。因为跑在本地，用的都是你自己的资源，速度很快。

随便粘贴一段内容给它，它会直接调用本地技能去写脚本：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

脚本写得很详细：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

把 TTS 的 API 给它之后，立刻就开始生成音频。最后的 MP3 没有问题，质量基本取决于你用的 TTS 模型好不好。MP3 和 Markdown 都支持下载。

我听了一下，效果还不错，至少说明这个工作流是完全跑通了 ✅

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

5' 生图 + 生视频

DeerFlow 也支持这两个功能。因为有子 Agent 的能力，你可以让它并行生成大量图片，这跟 Kimi Agent、MiniMax Agent 的能力差不多。

它生成图片之前会自己先写 prompt。我让它生成 12 张图，它会先为每张图各写一个提示词，全部写完以后再逐张生成，最后一次性交付给你：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

不过这里踩了一个坑：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

我用的是 API 中转站走的豆包 Seedream 5.0 模型，挺便宜的。但走中转站的话，它会往图片里加 AIGC 水印，导致 DeerFlow 做出来的图片没法正常显示。

解决方式很简单，跟 Claude Code 说一句，它会自动帮你把那些垃圾字节剥掉：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

所有图片都支持下载到本地：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

图片质量上，80% 取决于你接的图片生成模型，20% 取决于 Agent 框架写的 prompt。作为一个开源 Agent 产品，这个表现已经挺不错了：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

它也支持生成 PDF，比如把所有图片都转到一份 PDF 里：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

一些额外亮点

除了上面这些，DeerFlow 还有几个东西值得单独说说。

1' 记忆

DeerFlow 会在后台偷偷从你的对话里学东西，然后记到你的用户档案里。

说直白点，它会慢慢理解你关注的领域和使用习惯，在一些细节上给你更个性化的回应。我目前用的时间短，还没特别明显地感觉到差异，但这个机制确实是实打实跑着的 😆。

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

它的记忆里分了很多类别，每个类别还会标注一个「置信度」——对这条记忆的可信程度有多高。来源也可以直接查看，定位到你之前的具体对话：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

2' 技能

DeerFlow 内置了不少 skill，但都比较基础。重点是它支持你新建技能——之前给 OpenClaw 或者 Claude Code 下载的 skill，全部都可以导入进来，打通了，没有任何问题。

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

它还支持创建带有专属 prompt 的自定义智能体。这个功能现在很多 Agent 产品里都有了，比如 MiniMax Agent 里叫「专家智能体」，前面会有一段很长的前置提示词。

DeerFlow 也支持这个，你自己填 prompt，就能做出一个专属的智能体：

字节开源 DeerFlow 爆火 GitHub，我写了份从入门到精通的教程

一些避雷的坑

最后说几个需要避的坑。

第一，一定要搭配 Claude Code 用。

DeerFlow 是个本地项目，它没有任何错误提示。我用的过程中碰到过很多 API 接入的问题——它不会告诉你「你的 API 出问题了」，直接就断了。你在界面上跟它对话，它突然没反应了，你根本不知道是哪出的错。

如果没有代码基础，要去后台的各种 json 和 config 文件里排查问题，那真的太痛苦了。

所以最好的方式就是用 Claude Code 来安装、配置、排障。遇到什么问题，直接跟它说，它会帮你搞定一切。这也是为什么我前面说 Claude Code 是唯一的窗口，因为我们现在真的已经到了用智能体去操作智能体的阶段了。

第二，模型千万别图便宜。

前面已经说了很多次了，但真的太重要了。

当 Agent 的框架已经搭好了，工作流也做得很复杂了，你塞一个差模型进去，框架的能力完全发挥不出来，稍微复杂点的任务直接就跑不动。

DeerFlow 在 readme 里推荐了 Kimi 2.5、豆包的模型。但从我个人体验来看，最好用各家厂商当前最强的模型：智谱 GLM 5、Kimi 2.5、MiniMax，还有我一直在用的 Claude Sonnet 4.6。Claude 会贵一点，但它给你的体验确实是最好的。字节自己的豆包模型，我觉得一般 😭，不推荐。

拉回来说说我的整体感受。

玩了两天下来，我觉得 DeerFlow 确实够格火成这样。该有的东西它都做进去了，子 Agent 能并行跑，有记忆，能装技能，还有沙箱。

但它的天花板和地板，几乎完全取决于你接的模型。

框架好 + 模型强 = 真正能用的 Agent。

框架好 + 模型差 = 一堆报错和垃圾输出。

不过，这仍然是目前几乎最好的 Agent 开源项目，甚至没有之一。

任你随意 DIY，不过，这肯定没有 Manus 那样完善的功能模块，不过，都免费用了，我还能说啥呢。

文章来自于“AI Humanist by杉森楠”，作者 “杉森楠”。

关键词: AI新闻 , DeerFlow , DeerFlow教程 , Agent推荐

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务，堪称「云端超级打工人」而且做到了开源界GAIA性能天花板，达到了57.7%，超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址：GitHub：https://github.com/camel-ai/owl

OpenManus

【开源免费】OpenManus 目前支持在你的电脑上完成很多任务，包括网页浏览，文件操作，写代码等。OpenManus 使用了传统的 ReAct 的模式，这样的优势是基于当前的状态进行决策，上下文和记忆方便管理，无需单独处理。需要注意，Manus 有使用 Plan 进行规划。
项目地址：https://github.com/mannaandpoem/OpenManus

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点，无需魔法付费，即可无限制使用GPT-4o等多个海外模型产品。
在线使用：https://ffa.chat/

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales