省下 3000 万？字节版 Manus 突然免费上线，全网都在求教程

10488点击 2026-01-05 15:26

去年花 3000 万美元都买不到的团队，今年字节跳动自己做了个类似的产品，还限时免费。

刚刚，字节在海外悄悄上线了 AnyGen，功能看起来和当年想收购的 Manus 有点像——都是语音驱动的 AI 工作空间，能把你的语音、照片、想法直接变成文档、PPT、甚至故事书。

买不到？那就自己做。这背后藏着字节在 AI 办公赛道的野心。

收购被拒的故事：为什么 3000 万不够？

时间拉回到 2024 年初。

字节跳动高层曾与肖弘在香港单独会面，出价 3000 万美元收购蝴蝶效应（也就是后来开发出 Manus 的团队）。当时 Manus 的前身产品 Monica 刚开始高速增长，年度经常性收入（ARR）已经达到千万美金级别。

3000 万美元，按当时的估值来看，大概是 3 倍市销率（PS）。听起来不算低，但创始团队觉得这个价不够公允——毕竟他们上一轮融资估值就已经不止这个数了。

最终，这笔收购没谈成。

再往后的事你可能知道了：2025 年 3 月，Manus 正式上线，这是一款能够调度不同工具解决复杂问题的 Agent 产品，一发布就引发全球关注。今年 12 月中旬，Manus 宣布年度经常性收入（ARR）已突破 1 亿美元。

然后，Meta 以数十亿美元收购了开发 Manus 的公司蝴蝶效应，这是 Meta 成立以来第三大收购，仅次于 WhatsApp 和 Scale AI。

从 3000 万到数十亿，差了一百倍。

字节大概也意识到，当初那个价确实给低了。不过既然买不到，那就自己做一个——这就是 AnyGen 的由来。

AnyGen 是什么？核心功能拆解

字节在海外上线了一款 AI 办公产品 AnyGen，定位是"语音驱动的人工智能工作空间"。

简单说，它想做的事是：你随时长按录音，说出想法，AnyGen 就能帮你把这些碎片化的内容整理成可交付的文档、PPT、报告，甚至图文并茂的故事书。

产品定位

AnyGen 瞄准的是这样一群人：

内容创作者：需要快速把想法变成文章、故事、视频脚本
产品经理：开完会要整理需求文档和 PPT
个人知识工作者：想用 AI 提升工作效率，但不想学复杂的 Prompt

核心卖点就一句话：别打字了，直接说。

核心功能模块

AnyGen 能随时让语音笔记、照片和自己的想法，转化为文档、见解和演示文稿等内容。具体来说，它有 4 个核心模块：

模块 1：文档生成

省下 3000 万？字节版 Manus 突然免费上线，全网都在求教程

功能：语音或文字输入 → 自动生成结构化文档

你可以长按录音键，边想边说，AnyGen 会实时转成文字。说完之后，点击"生成文档"，它就能自动整理成有标题、有段落、有逻辑的文档。

生成的文档支持飞书式的编辑体验，可以继续修改调整。

模块 2：演示文稿生成

功能：内容 → PPT

省下 3000 万？字节版 Manus 突然免费上线，全网都在求教程

把文档内容一键转成 PPT，速度很快，而且支持单页编辑。这意味着你不用全部重新生成，只需要调整某一页就行。

这个功能对产品经理和需要频繁做汇报的人来说挺实用——开完会录个音，2 分钟就能生成一份汇报材料。

模块 3：故事书 / 漫画生成

省下 3000 万？字节版 Manus 突然免费上线，全网都在求教程

功能：创意构思 → 图文内容

这是 AnyGen 比较有意思的一个功能。你可以输入一个主题（比如"讲解光合作用的趣味故事书"），AnyGen 会调用 Nano Banana来生成配图，然后自动排版成一本图文并茂的故事书。

从试用反馈看，这个功能有点像 NotebookLM 的多模态内容生成——不只是文字，还能生成图片、甚至漫画风格的内容。

模块 4：数据分析（通用智能体）

省下 3000 万？字节版 Manus 突然免费上线，全网都在求教程

功能：上传数据 → 可视化洞察

你可以上传 Excel、CSV，或者直接拍张数据表格的照片，AnyGen 会自动分析数据，生成图表和洞察报告。

这个功能的门槛很低，不需要你懂 SQL 或者写代码，适合非技术背景的人快速做数据可视化。

三大应用场景实战

光看功能介绍可能不够直观，咱们来看几个实际的使用场景。

场景 1：会议记录自动化

需求：产品经理开完需求评审会，要整理会议纪要 + 做一份汇报 PPT

操作步骤：

1. 会议中：打开 AnyGen，长按录音键，记录讨论的核心要点

• 不用一字不落地记录，只需要说出关键信息

• 支持多次录音，随时补充

2. 会后整理：点击"生成文档"

• AnyGen 自动把语音转成结构化文档

• 自动提取核心观点、待办事项、时间节点

3. 生成 PPT：选中文档内容，一键转 PPT

• 自动生成标题页、内容页、总结页

• 支持单页编辑，调整某一页的内容或排版

预期结果：10 分钟的会议 → 2 分钟生成完整材料

对比传统方式（听录音 → 整理笔记 → 写文档 → 做 PPT），时间至少压缩了 80%。

场景 2：创意内容快速成型

需求：给孩子做一本科普故事书，讲解光合作用的原理

操作步骤：

1. 语音描述需求：

• "我想做一本讲光合作用的故事书，要有趣、有插图，适合 8 岁小孩看"

2. AnyGen 生成内容：

• 调用 Nano Banana2 模型生成配图

• 自动撰写故事文本（用拟人化的方式讲植物的光合作用）

• 排版成可下载的 PDF 或图片格式

3. 微调细节：

• 可以针对某一页的图片或文字进行修改

• 调整配色、字体、插图风格

预期结果：从构思到成品 < 5 分钟

这个场景特别适合内容创作者、教育工作者，或者想给孩子做点个性化内容的家长。

场景 3：数据分析可视化

需求：运营人员拿到一份用户增长数据，要快速做成可视化报告给老板看

操作步骤：

1. 上传数据：

• 直接上传 Excel 文件

• 或者拍张表格照片（AnyGen 会自动识别）

2. 语音说明需求：

• "帮我分析过去 3 个月的用户增长趋势，重点看新增用户和留存率"

3. 自动生成报告：

• AnyGen 生成折线图、柱状图

• 自动提炼关键洞察（比如"10 月新增用户环比增长 25%"）

• 输出可下载的报告（PDF 或 PPT 格式）

预期结果：非技术人员也能 5 分钟做出专业级数据报告

AnyGen vs Manus：功能对比

既然 AnyGen 被拿来和 Manus 对比，那它俩到底有什么异同？

相似之处

两款产品确实有一些共同点：

都是 AI Agent 产品：不只是简单的对话式 AI，而是能主动调度工具、执行任务
都支持多模态输入：语音、文字、图片都能作为输入
都强调"语音驱动"：降低使用门槛，让用户用说的方式完成工作

核心差异

但如果深入看，两者的定位和技术路线其实挺不一样：

省下 3000 万？字节版 Manus 突然免费上线，全网都在求教程

简单说：

Manus 更像是一个"AI 助理"，你给它一个复杂任务（比如"帮我分析这份财报并生成投资建议"），它会自己调用计算器、搜索引擎、数据分析工具来完成。
AnyGen 更像是一个"内容生成器"，你给它原料（语音、文字、图片），它帮你加工成成品（文档、PPT、故事书）。

为什么字节没做成 Manus？

这可能跟字节的技术积累和战略选择有关：

1. 方向选择：字节在内容生成领域有深厚积累（剪映、即梦、豆包），做内容生成类工具更顺手。而 Manus 的核心是 Agent 编排，这需要不同的技术栈。

2. 市场策略：AnyGen 选择海外免费试水，降低用户门槛。Manus 则是订阅制，走高端路线。

3. 产品基因：字节有飞书（协作）+ 豆包（大模型）的基础，把这些能力整合到 AnyGen 里，比从零做一个 Agent 编排系统更快。

字节的 AI 办公版图

AnyGen 不是字节在 AI 办公领域的第一次尝试。如果把字节的产品线拉出来看，能看到一个逐渐清晰的版图。

省下 3000 万？字节版 Manus 突然免费上线，全网都在求教程

字节产品战略布局

三条产品线

1. 飞书（Lark）：企业协作平台

• 定位：对标 Slack、Microsoft Teams

• 现状：国内发展不错，但海外表现平平

• 问题：缺少差异化竞争力

2. 豆包：对话式 AI

• 定位：C 端 AI 助手

• 数据：DAU 已突破 1 亿大关，是字节历史上推广费用最少的破亿产品

• 市场：主要在国内

3. AnyGen：AI 办公工具

• 定位：语音驱动的内容生成工具

• 市场：主要面向海外

• 策略：限时免费，快速获取用户

战略意图

从这三条线可以看出字节的意图：

补齐海外 AI 办公短板：飞书在海外没做起来，AnyGen 想换个角度切入——不做复杂的企业协作，而是做简单易用的个人效率工具。
对标 NotebookLM、Gamma.app：这两款产品在海外很火，都是用 AI 做内容生成。AnyGen 的功能和它们有重叠，但加上了字节擅长的语音交互。
利用内容生成优势：字节有剪映（视频剪辑）、即梦（AI 绘画）的产品经验，这些能力可以直接复用到 AnyGen 里。

面临的挑战

当然，AnyGen 要真正做起来，还有不少挑战：

1. 海外竞争激烈：OpenAI、Google、Notion AI 都在做类似的事，而且有更强的品牌认知度。

2. 免费策略能否持续：现在是限时免费，但如果后续转成付费，用户会不会买单？Manus 能做到 ARR 破亿，是因为它真的解决了专业用户的刚需。AnyGen 能不能找到自己的刚需场景？

3. 如何差异化竞争：语音输入不是独家能力，Google、OpenAI 也有。AnyGen 需要找到自己的护城河——可能是更好的中文支持？更低的使用门槛？还是和飞书、豆包的深度整合？

现在免费，抓紧试用

如果你想体验 AnyGen，现在是个好时机——限时免费，不用付费就能试完整功能。

访问地址：https://www.anygen.io/home?invitation_code=Z5BMA0IHK0C95W6（需外网环境）

建议先从简单的场景试起：

录一段语音，让它生成文档
上传一张数据表格，看看它能不能做出可视化
试试让它做一份 PPT

找到适合自己的使用场景，然后再决定要不要长期用。

最后问个问题：你觉得 AnyGen 能成为下一个爆款 AI 工具吗？还是说它只是字节在海外市场的又一次试水？欢迎评论区聊聊你的看法。

我是AIGC 胶囊，在这个快节奏的AI时代，我想陪你走得稳一点。不分享我没用过的，不推荐我没验证的。我把踩过的坑填平，把验证过的路铺好，只为了让你在应用AI时，少走弯路，多拿结果。

文章来自于“AIGC胶囊”，作者 “AI探路者”。

关键词: AI新闻 , 字节版Manus , AnyGen , 智能体

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务，堪称「云端超级打工人」而且做到了开源界GAIA性能天花板，达到了57.7%，超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址：GitHub：https://github.com/camel-ai/owl

OpenManus

【开源免费】OpenManus 目前支持在你的电脑上完成很多任务，包括网页浏览，文件操作，写代码等。OpenManus 使用了传统的 ReAct 的模式，这样的优势是基于当前的状态进行决策，上下文和记忆方便管理，无需单独处理。需要注意，Manus 有使用 Plan 进行规划。
项目地址：https://github.com/mannaandpoem/OpenManus

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用，可以让没有任何绘画基础的用户完成属于自己的漫画创作。
项目地址：https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file
在线使用：https://aicomicfactory.app/

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0