去年花 3000 万美元都买不到的团队,今年字节跳动自己做了个类似的产品,还限时免费。
刚刚,字节在海外悄悄上线了 AnyGen,功能看起来和当年想收购的 Manus 有点像——都是语音驱动的 AI 工作空间,能把你的语音、照片、想法直接变成文档、PPT、甚至故事书。
买不到?那就自己做。这背后藏着字节在 AI 办公赛道的野心。
时间拉回到 2024 年初。
字节跳动高层曾与肖弘在香港单独会面,出价 3000 万美元收购蝴蝶效应(也就是后来开发出 Manus 的团队)。当时 Manus 的前身产品 Monica 刚开始高速增长,年度经常性收入(ARR)已经达到千万美金级别。
3000 万美元,按当时的估值来看,大概是 3 倍市销率(PS)。听起来不算低,但创始团队觉得这个价不够公允——毕竟他们上一轮融资估值就已经不止这个数了。
最终,这笔收购没谈成。
再往后的事你可能知道了:2025 年 3 月,Manus 正式上线,这是一款能够调度不同工具解决复杂问题的 Agent 产品,一发布就引发全球关注。今年 12 月中旬,Manus 宣布年度经常性收入(ARR)已突破 1 亿美元。
然后,Meta 以数十亿美元收购了开发 Manus 的公司蝴蝶效应,这是 Meta 成立以来第三大收购,仅次于 WhatsApp 和 Scale AI。
从 3000 万到数十亿,差了一百倍。
字节大概也意识到,当初那个价确实给低了。不过既然买不到,那就自己做一个——这就是 AnyGen 的由来。
字节在海外上线了一款 AI 办公产品 AnyGen,定位是"语音驱动的人工智能工作空间"。
简单说,它想做的事是:你随时长按录音,说出想法,AnyGen 就能帮你把这些碎片化的内容整理成可交付的文档、PPT、报告,甚至图文并茂的故事书。
AnyGen 瞄准的是这样一群人:
核心卖点就一句话:别打字了,直接说。
AnyGen 能随时让语音笔记、照片和自己的想法,转化为文档、见解和演示文稿等内容。具体来说,它有 4 个核心模块:

功能:语音或文字输入 → 自动生成结构化文档
你可以长按录音键,边想边说,AnyGen 会实时转成文字。说完之后,点击"生成文档",它就能自动整理成有标题、有段落、有逻辑的文档。
生成的文档支持飞书式的编辑体验,可以继续修改调整。
功能:内容 → PPT

把文档内容一键转成 PPT,速度很快,而且支持单页编辑。这意味着你不用全部重新生成,只需要调整某一页就行。
这个功能对产品经理和需要频繁做汇报的人来说挺实用——开完会录个音,2 分钟就能生成一份汇报材料。

功能:创意构思 → 图文内容
这是 AnyGen 比较有意思的一个功能。你可以输入一个主题(比如"讲解光合作用的趣味故事书"),AnyGen 会调用 Nano Banana来生成配图,然后自动排版成一本图文并茂的故事书。
从试用反馈看,这个功能有点像 NotebookLM 的多模态内容生成——不只是文字,还能生成图片、甚至漫画风格的内容。

功能:上传数据 → 可视化洞察
你可以上传 Excel、CSV,或者直接拍张数据表格的照片,AnyGen 会自动分析数据,生成图表和洞察报告。
这个功能的门槛很低,不需要你懂 SQL 或者写代码,适合非技术背景的人快速做数据可视化。
光看功能介绍可能不够直观,咱们来看几个实际的使用场景。
需求:产品经理开完需求评审会,要整理会议纪要 + 做一份汇报 PPT
操作步骤:
1. 会议中:打开 AnyGen,长按录音键,记录讨论的核心要点
• 不用一字不落地记录,只需要说出关键信息
• 支持多次录音,随时补充
2. 会后整理:点击"生成文档"
• AnyGen 自动把语音转成结构化文档
• 自动提取核心观点、待办事项、时间节点
3. 生成 PPT:选中文档内容,一键转 PPT
• 自动生成标题页、内容页、总结页
• 支持单页编辑,调整某一页的内容或排版
预期结果:10 分钟的会议 → 2 分钟生成完整材料
对比传统方式(听录音 → 整理笔记 → 写文档 → 做 PPT),时间至少压缩了 80%。
需求:给孩子做一本科普故事书,讲解光合作用的原理
操作步骤:
1. 语音描述需求:
• "我想做一本讲光合作用的故事书,要有趣、有插图,适合 8 岁小孩看"
2. AnyGen 生成内容:
• 调用 Nano Banana2 模型生成配图
• 自动撰写故事文本(用拟人化的方式讲植物的光合作用)
• 排版成可下载的 PDF 或图片格式
3. 微调细节:
• 可以针对某一页的图片或文字进行修改
• 调整配色、字体、插图风格
预期结果:从构思到成品 < 5 分钟
这个场景特别适合内容创作者、教育工作者,或者想给孩子做点个性化内容的家长。
需求:运营人员拿到一份用户增长数据,要快速做成可视化报告给老板看
操作步骤:
1. 上传数据:
• 直接上传 Excel 文件
• 或者拍张表格照片(AnyGen 会自动识别)
2. 语音说明需求:
• "帮我分析过去 3 个月的用户增长趋势,重点看新增用户和留存率"
3. 自动生成报告:
• AnyGen 生成折线图、柱状图
• 自动提炼关键洞察(比如"10 月新增用户环比增长 25%")
• 输出可下载的报告(PDF 或 PPT 格式)
预期结果:非技术人员也能 5 分钟做出专业级数据报告
既然 AnyGen 被拿来和 Manus 对比,那它俩到底有什么异同?
两款产品确实有一些共同点:
但如果深入看,两者的定位和技术路线其实挺不一样:

简单说:
这可能跟字节的技术积累和战略选择有关:
1. 方向选择:字节在内容生成领域有深厚积累(剪映、即梦、豆包),做内容生成类工具更顺手。而 Manus 的核心是 Agent 编排,这需要不同的技术栈。
2. 市场策略:AnyGen 选择海外免费试水,降低用户门槛。Manus 则是订阅制,走高端路线。
3. 产品基因:字节有飞书(协作)+ 豆包(大模型)的基础,把这些能力整合到 AnyGen 里,比从零做一个 Agent 编排系统更快。
AnyGen 不是字节在 AI 办公领域的第一次尝试。如果把字节的产品线拉出来看,能看到一个逐渐清晰的版图。

字节产品战略布局
1. 飞书(Lark):企业协作平台
• 定位:对标 Slack、Microsoft Teams
• 现状:国内发展不错,但海外表现平平
• 问题:缺少差异化竞争力
2. 豆包:对话式 AI
• 定位:C 端 AI 助手
• 数据:DAU 已突破 1 亿大关,是字节历史上推广费用最少的破亿产品
• 市场:主要在国内
3. AnyGen:AI 办公工具
• 定位:语音驱动的内容生成工具
• 市场:主要面向海外
• 策略:限时免费,快速获取用户
从这三条线可以看出字节的意图:
当然,AnyGen 要真正做起来,还有不少挑战:
1. 海外竞争激烈:OpenAI、Google、Notion AI 都在做类似的事,而且有更强的品牌认知度。
2. 免费策略能否持续:现在是限时免费,但如果后续转成付费,用户会不会买单?Manus 能做到 ARR 破亿,是因为它真的解决了专业用户的刚需。AnyGen 能不能找到自己的刚需场景?
3. 如何差异化竞争:语音输入不是独家能力,Google、OpenAI 也有。AnyGen 需要找到自己的护城河——可能是更好的中文支持?更低的使用门槛?还是和飞书、豆包的深度整合?
如果你想体验 AnyGen,现在是个好时机——限时免费,不用付费就能试完整功能。
访问地址:https://www.anygen.io/home?invitation_code=Z5BMA0IHK0C95W6(需外网环境)
建议先从简单的场景试起:
找到适合自己的使用场景,然后再决定要不要长期用。
最后问个问题:你觉得 AnyGen 能成为下一个爆款 AI 工具吗?还是说它只是字节在海外市场的又一次试水?欢迎评论区聊聊你的看法。
我是AIGC 胶囊,在这个快节奏的AI时代,我想陪你走得稳一点。不分享我没用过的,不推荐我没验证的。我把踩过的坑填平,把验证过的路铺好,只为了让你在应用AI时,少走弯路,多拿结果。
文章来自于“AIGC胶囊”,作者 “AI探路者”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。
项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file
在线使用:https://aicomicfactory.app/
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0