蚂蚁的 AI,开始像蚂蚁一样干活了

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
蚂蚁的 AI,开始像蚂蚁一样干活了
6053点击    2025-08-29 16:31

如何让 AI 像一个团队一样工作?


蚂蚁的 AI,开始像蚂蚁一样干活了


大厂在 AI Agent 上的每一步动作,都值得紧盯。因为没人能预测,一个看似小小的产品,最终会被扩展到多大规模,串联出怎样的「新业务体系」。


时间拉回到 2024 年 9 月,在上海 Inclusion·外滩大会上,蚂蚁推出了他们的 Agent开发平台「百宝箱 Tbox」。


然而,疑问也随之而来:


蚂蚁,为什么要做这样一个 Agent 开发平台?


Tbox 团队用行动回应:


从最初上线到补全工作流开发、推出 MCP 专区,再到 2025 年 7 月发布企业版,Tbox 一直在强化「开发者工具」属性。


Tbox 也打通了支付宝的生态:用户做好的 Agent 可以一键部署至支付宝小程序、生活号等多种场景。


其目前正在内测「多 Agent 协作」功能,把单体 Agent 升级为团队化 Agent,像「多工种的蚂蚁」一样,让复杂任务能被分工协作完成。


「十字路口」团队第一时间获得了内测资格,并测评了 Tbox 「多 Agent 协作」,我们来一起看看:蚂蚁做的 AI ,如何实现像蚂蚁一样工作的效果。


收录游戏库的「游戏科学」社区


Tbox 当前支持一句话生成多种格式的产物,包括但不限于PPT、网页报告、网页应用、播客以及文档等等。


正好,写这篇文章的时候,「游戏科学」刚好发布了他们的「黑神话续作」,我决定借用下他们的名头,让 Tbox 搭建一个以「游戏科学」为主题的互动游戏社区网站。


提示词如下:


帮我设计一个 「游戏科学」主题的互动游戏社区网站,简洁、年轻、有动效。 功能需求: 首页:展示「游戏科学」的核心作品与最新资讯,采用大图轮播 + 动态横幅。 游戏库页面:收录 PS5、Switch、Xbox、Steam 等多平台游戏,提供每款游戏的售价、详细介绍、发售日期与平台支持。每个平台10款游戏 搜索与筛选功能:支持按平台、价格区间、游戏类型进行筛选。 社区互动:玩家可以点赞、评论、收藏游戏条目,并在社区内发帖讨论。 动态交互:悬停时展示游戏封面动态效果,点击进入详情页。社区讨论区采用卡片式设计,支持表情与图片上传。 美术风格:年轻化、活力感,强调动效设计与游戏氛围(霓虹色、深色模式为主)。 额外功能:推荐区块,智能推送相似游戏;活动区块,用于展示联机活动、打折信息和「游戏科学」相关的官方活动。


输入提示词后,一开始,Tbox 会提醒我需要选择一个「小组」。我了解了下才知道 Tbox 的使用逻辑比较有意思。


它本身支持的是「多 Agent 协作」架构,体现形式则是在提示词输入框左下角设立了一个「小组」。


蚂蚁的 AI,开始像蚂蚁一样干活了


在这个小组里,你可以选择多种格式、多种领域的任务,每一种小组都为一种任务特化。每一个「Agent 小组」里的 Agent 都可以单独拎出来,自己去配置一个专属小组。


像是「游戏科学社区」这种稍微复杂点的案例,我一般都会自己做一个「Agent 小组」,我给它命名为「创意与智能协作小组」:


蚂蚁的 AI,开始像蚂蚁一样干活了


这里不得不说的是,Tbox 的组合 Agent 工作流比较简单,它没有做传统 AI 工作流那种思维导图,而是可以直接去左侧 Agent 栏里选择,然后在右面的描述框里「大致的描写下功能即可」。


实在不行,可以直接点击「AI 生成」:


蚂蚁的 AI,开始像蚂蚁一样干活了


当我输入提示词并点击开始后,Tbox 会首先「整理、结构化」我的提示词,在这一步可以继续调整:


蚂蚁的 AI,开始像蚂蚁一样干活了


Tbox 整个工作流的逻辑是:


【1】先将用户的任务拆解;


【2】然后从「Agent 小组」中挑选出合适的「专家 Agent 」;


【3】交给「专家 Agent 」依次接力完成,指定任务顺序。


就像下面这样:


蚂蚁的 AI,开始像蚂蚁一样干活了


在确认好整个工作流顺序之后,Tbox 看起来真的很像是一个大厂团队 Leader,开始 「艾特 @」团队里的每一个专家。


蚂蚁的 AI,开始像蚂蚁一样干活了


由于 Tbox 的一个比较大的特点是在比较短的时间内,做出一个「能够交付」的成品。所以,我有点好奇,它在一开始的「深度研究」信息积累阶段,做的怎么样。于是,我一个一个文件回去看了下,录制了一个超长的 GIF。你能看到 Tbox 在前期阶段做的准备工作有多全:


蚂蚁的 AI,开始像蚂蚁一样干活了


作为一个「数字控|,我算了下这份报告内容量,大概有 2-3 万字左右,而生成的时间确不超过 3 分钟:


蚂蚁的 AI,开始像蚂蚁一样干活了


而这也只是「深度研究」的第一步,后面还会调用「全面搜索 」再做一大波搜索:


蚂蚁的 AI,开始像蚂蚁一样干活了


最后,这个由多 Agent 协作生成的「游戏科学社区」网站,基本上覆盖了一个完整游戏社区所需的核心功能,像是推荐游戏库、活动资讯,玩家互动区域。


游戏库里按平台(PS5 / Switch / Xbox / PC / Steam) 分类,提供 10 款热门游戏的售价、类型、评分与简述。也支持价格区间、游戏类型筛选。


我们直接看网站的最后成果,我录制了一个完整的 GIF。


蚂蚁的 AI,开始像蚂蚁一样干活了


整套网站内容的生成时间,不超过 10 分钟,速度还是比较快的。总体而言,这个网站内容达成了「资讯 + 游戏库 + 社区 + 活动」的完整闭环小目标。


黑神话:钟馗历史揭秘网站


由于 Tbox 在生成整套网站内容上的速度确实很快,所以我忍不住多尝试了几次。


比如,最近「游戏科学」开发的黑神话系列第二部作品《黑神话:钟馗》,在 2025 科隆游戏展的展前发布会上,公布了他们的首支 CG。这个人物原型来自中国古代神话传说,本身就有着浓厚的历史与文化色彩。


所以,我试着让 Tbox 做一个历史揭秘网站,给它一段很简短的提示词:


生成一个黑神话:钟馗的历史揭秘网站,附带历史时间轴


蚂蚁的 AI,开始像蚂蚁一样干活了


生成的结果相当完整。每个板块不仅都配上了与内容相呼应的插画(例如唐代原始形象、傩戏面具、古代绘画、现代游戏概念图),而且整体叙事逻辑也很清晰。


网站结构设立了 5 个主要板块:钟馗起源、民间传说、文化演变、历史时间轴、钟馗文化象征。


蚂蚁的 AI,开始像蚂蚁一样干活了


从展示效果来看,Tbox 生成的页面图文并茂,文字与图片的相对位置都比较「稳定」没有出现太大的幻觉。


换句话说,Tbox 在这里不只是「写了一篇文章」,而是以完整的叙事和可视化表达,帮我快速搭建出了一个主题明确、逻辑自洽的沉浸式网站。


最后,我注意到,Tbox 是真的很喜欢在项目的生成中做一些「很有逻辑性的时间轴」,并且以比较统一的风格插入进了网站中。这可能与它层层递进的多 Agent 流有关,上下文的衔接很流程。


世界百大默剧影展的介绍 PPT + 播客


上面的「游戏科学社区」案例,其实还只是我在一个「提示词输入框」里,交给 Tbox 去完成的单一任务。


在实际体验过后,我开始好奇:既然 Tbox 本身支持多 Agent 协作,那是不是意味着可以进一步让不同的 Agent 各司其职,一起完成更复杂的内容生产?


于是,我尝试了第二个案例:做一个关于「默剧的古老起源」的组合任务,让 Tbox 同时生成 PPT 与播客,并测试它在多角色分工下的表现。


提示词如下:


做一个世界百大默剧影展的介绍PPT,并为其生成一个播客内容


我注意到 Tbox 在多 Agent 工作流中的衔接很顺畅。


举个例子,当我让它同时生成「PPT + 播客」时,「播客生成 Agent 」并不是从 0 开始,而是会自动调用上一步由 PPT 制作 Agent 输出的内容。


把其中的逻辑框架、关键信息甚至部分表达方式延伸到播客脚本中:


蚂蚁的 AI,开始像蚂蚁一样干活了


我们直接看结果,以下是 PPT 内容:


蚂蚁的 AI,开始像蚂蚁一样干活了


可以看得出来,PPT 整体不仅在排版上保持了一致,还在色彩、字体和版式细节上体现出一种统一的风格语言。


我从中,截了几张图出来:


蚂蚁的 AI,开始像蚂蚁一样干活了


蚂蚁的 AI,开始像蚂蚁一样干活了


蚂蚁的 AI,开始像蚂蚁一样干活了


蚂蚁的 AI,开始像蚂蚁一样干活了


然后,我们再来看看播客。


我注意到,在点击播客内容音频后,Tbox 专门设置了一个显示区域,还做了个播放器前端页面,旁边就是所有的逐字稿:


蚂蚁的 AI,开始像蚂蚁一样干活了


蚂蚁的 AI,开始像蚂蚁一样干活了


两个产物在主题、叙事节奏和信息一致性上都保持了递进的关系,听上去就像是一个团队先写了演示文稿,再顺势进一步根据信息的积累,录制成音频节目。


换句话说,Tbox 并不是在「并行生成两个结果」,而更像是模拟了一个真实内容团队的协同过程:前一位团队成员搜集完信息做好一个成品后,后一个人在前者的基础上,继续前进,再做一个成品。


这很像是在同一间工作室里,先做了演示,再顺势录了一档播客。


国内外初创企业的可视化整理


我们再来看最后一个案例。


前面两个案例里,Tbox 已经展示了它在「网站搭建」和「多模态内容生产(PPT + 播客)」上的能力。而当我继续探索它的「灵感区域」,观察其他用户的用法时,我注意到 Tbox 在「可视化任务」上同样有很强的潜力。


尤其是涉及到需要图表、数据展示和结构化表达的场景,它的表现方式比单纯的文字生成更直观、更具说服力。


提示词如下:


研究一下目前一些非常火的国内外初创企业,可视化他们的融资信息,给出融资时间线,整理这行业。


直接看结果:


蚂蚁的 AI,开始像蚂蚁一样干活了


为了进一步看看 Tbox 在可视化场景下的表现,我又针对相同的主题多测试了几次,让它重复生成不同版本的结果。过程中我特意截取了几张图,看看它的排版、配色以及数据呈现。整体来看,Tbox 的可视化能力确实不错!


它能够快速生成结构清晰、图文搭配合理的图表页面,并且在色彩风格和布局设计上保持一致性,呈现出一种「套件化」的完成感:


蚂蚁的 AI,开始像蚂蚁一样干活了


蚂蚁的 AI,开始像蚂蚁一样干活了


蚂蚁的 AI,开始像蚂蚁一样干活了


蚂蚁的 AI,开始像蚂蚁一样干活了


测评到这里,我们不妨退后一步,稍微总结下 Tbox 在产品逻辑上的展现。


它的核心工作模式是将用户输入的复杂任务进行拆解,然后分配给不同职能的「专家 Agent」,通过接力的方式依次完成,最终整合成品。


在实际体验过程中,我们看到了优点,也看到了为了弥补用户体验尚不完满的努力:


➤ 优点在于「稳定可靠」:


Tbox 在搭建「游戏科学社区」网站时,它会遵循行业内最成熟的网站架构:首页轮播图、游戏库、社区板块。这是一个绝对不会错的方案,能稳定地拿到 85-90 分。


➤ 努力在于「快速迭代」:


Tbox 的整个工作流程,在视觉方面比较统一,同时也正在迅速迭代,弥补个性化的用户体验。


最后,我发现百宝箱 Tbox 已经构建出了一个基础版本的 Agent 生态,像是支持外部 Agent 的加入,发布 Agent 到社区,MCP 接入等等,甚至还有「创作收益打赏」。


蚂蚁的 AI,开始像蚂蚁一样干活了


不过,目前的 Tbox 生态部分,说实在的,还仍在成长中。


但上述功能已经清晰地勾勒出了 Tbox 对「 Agent 产品未来到底该是什么样的?」给出了规划:从一个「工具的提供者」,转变为一个「生态的运营者」。


这条路虽然漫长,但无疑充满了想象空间。


文章来自于微信公众号“十字路口Crossing”,作者是“镜山”。


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0