我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

9300点击 2026-05-28 17:52

玩了这么久 AI，相信大家都经常遇到过这种情况：

你跟 AI 说，帮我做一个项目。它说好的。第一版出来，你觉得还行。然后你开始修改，一轮、两轮、三轮、十轮。你发现每一轮你都在重复交代同一件事，像一个无限循环。

更崩溃的是，你把所有规则都交代完了，关掉电脑去睡觉。第二天打开一看，它停在那，特么的卡住了。。。

你不问，它不动。你在前面拉，它在后面跟。你一松手，它就原地躺平。

这就是现阶段大多数 AI 工具的真相：它们不是协作者，是响应器。

而今天，面壁智能联合清华大学、OpenBMB 开源了发布了一款新产品，叫 PilotDeck，定位很有意思：智能体协作舱。

听起来像一个空间站的名字，但本质上，它想回答一个问题：

AI 能不能不只是回消息，而是做项目？

为了试试这个问题的答案，我把一个压在心底很久的想法，丢进了 PilotDeck。

我想做一个火影跑团

事情要从上个月说起，重刷火影的时候看到鸣人蹲在秋千上，突然冒出一个念头：如果我是木叶村的忍者，我的故事会是什么样。

我是个跑团玩家，但市面上找不到好的火影模组。要么是几页设定糊弄人，要么把 DnD 规则硬套一个火影皮，完全没有那个味。找不到是吧，那我自己做一个。

对了，还是先简单解释一下跑团是什么。

它的全称叫 TRPG——桌面角色扮演游戏。你应该听过《龙与地下城》（DnD），这就是跑团的代表作。

我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

跑团的玩法很简单：一个主持人（DM）负责讲故事、定规则、抛骰子，若干个玩家每人扮演一个角色，大家围坐在桌前，在同一个虚构世界里共同冒险。没有画面，没有特效，全凭想象力驱动。

它跟剧本杀有点像，但自由度大得多。剧本杀路线是固定的，跑团里你做什么都可以：只要 DM 同意，骰子过了，你甚至可以用嘴遁说服最终大 Boss。

但我要做的不是玩别人的跑团，我想自己做一个。

玩家从第七班成立开始，历经铃铛测试、波之国任务、中忍考试，一路推向木叶崩溃。需要完整的剧情脚本、DnD 5e 规则改编、玩家角色卡、DM 指引手册。

这可不是写一篇文章这么简单，毕竟这是一个游戏，要有很多复杂的设定，这是一个需要反复测试、迭代、修复的系统工程。

最开始，我把这个需求在其他 agent 工具上试了几次，发现一个残酷的事实：生成第一版从来不是问题的终点，它只是问题的起点。

铃铛测试里，玩家骰子一不过就卡关。再不斩的数值太强，一刀下去全员劝退。白的那场战斗只有战斗，没有情绪——角色直接废了。中忍考试每个人都单线作战，完全没有剧情交织感。最后的我爱罗决战，只能硬打，不能嘴遁。。。这还算什么火影？

就在快放弃的时候，收到面壁智能的内测邀请，我翻了翻产品逻辑，发现它想解决的问题和我当时的处境一模一样。AI 能不能不只是回消息，而是做项目。AI 能不能记住规则，能在你睡觉的时候继续干活，能自己发现你漏了什么。

我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

我心想，那就正好拿这个项目来考验考验你，反正我向来的测试思路就是，我这两天就想做这个，就看你能不能把这事给我办成。

于是我把项目丢进了 PilotDeck。目标很明确：做一套完整能开桌的火影 TRPG 模组，玩家从第七班成立开始，经历铃铛测试、波之国任务、中忍考试，一路跑到木叶崩溃。

我先给它喂了一个 DnD 规则：

我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

等它消化完了，然后给出任务，

帮我设计一个 10 小时左右的火影 TRPG 剧情。

我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

然后 PilotDeck 就跑了第一版出来——

果然还是不行。

铃铛测试卡关，再不斩数值太强，白的战斗没有情绪，中忍考试各打各的，我爱罗只能硬打不能嘴遁。

我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

三轮迭代，越改越好

但故事还没完。

PilotDeck 不一样的地方在于，你指出问题，它自己会改。

铃铛测试 DC 值不对，它重算了。再不斩一刀太强，它下调了数值还加了撤退路径。白的剧情太干，它把战斗和情绪线重新交织在一起。我爱罗那段，专门加了一套嘴遁判定规则。

我一共让它改了三轮。第一轮修数值和难度曲线，第二轮补剧情分支和情感线，第三轮做边界检查和格式统一。每一轮都是自动完成的，我把测试结论丢进去，它自己对照着改，改完自动跑测试，然后把改动摘要列出来。

最让我服气的是，上一轮改对了的东西，下一轮不会再崩回去。

中忍考试的赛制第一轮改成了单挑，后面两轮再没错过。白的情绪线第二轮补上之后，第三轮它自己在那条线上又加了两处细节。你能明显感觉到，这个项目在它手里越来越好。

我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

三轮之后我跑了一遍完整测试，从头到尾没有明显卡点，能明显感觉到 PilotDeck 的每一次修改都长在同一个项目上，改一轮，好一轮。

PilotDeck 解决的就是这些问题，它的设计哲学很清晰：把 AI 从一个对话窗口变成一个项目工作站。

核心叫 WorkSpace：一个项目一个舱。

这个设计初看很朴素，就像一个项目管理工具。但用进去之后，你会发现它跟市面上所有 Agent 工具的差异所在。

大多数 Agent 工具的基本单位是对话。

一个 Chat，就是一个工作边界。

你问它答，窗口一多，边界就模糊了。

今天我让它写公众号，明天让它做跑团，后天做产品文档：所有东西混在一个上下文里，你甚至不知道 AI 那句离谱的回答是从哪个项目里串过来的。

有些产品也做了项目隔离，但本质上还是「文件夹+静态规则」。

你把文件放进去，把规则写好，但记忆是可见的吗？是可以追溯的吗？成本能归因到具体任务吗？技能会随着项目推进而进化吗？

这些问题，PilotDeck 给出了不同的答案。

三个最深的印象

用火影跑团这个项目，我依次讲三个让我印象最深的地方。

第一个：记忆白盒化。

做跑团最怕什么？不是 AI 写得不好，是它今天记得，明天忘了。

我的火影跑团有很多不能丢的规则：基于 DnD 5e 的 d20 判定系统，玩家必须有高光时刻，失败不能截断剧情，而应该生出新分支，再不斩要强，但要给玩家留撤退路径，白的战斗要保留情感张力，我爱罗必须允许嘴遁成立。

这些规则如果用普通 AI 工具维护，你会变成一个人肉复读机。每一次新对话，你都得重新交代一遍。交代到第三十遍，你就会开始怀疑自己到底在干嘛。

PilotDeck 的 Memory 分了两层：Project Memory 记录项目目标、进度和限制条件；Feedback Memory 沉淀你的偏好和每一次修正反馈。这些记忆不是飘在对话里的，是固化成项目资产了。

更重要的是，你能看见它记了什么。

这个细节，用过的都懂。

AI 的记忆向来是个黑盒。它好像记住了什么，但你不知道到底是什么。它某天突然按一个诡异的方向回答你，你想破脑袋也不知道是哪句话种下的因果。你想纠偏，但连定位都做不到。

PilotDeck 的项目记忆是白盒的。可以查看、可以编辑、可以删除。

我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

例如我增加了团藏的 boss 战项目，可以在记忆里追加或编辑这个项目的设定，就好比可以打上各式各样的补丁，让整个跑团可以插进更多的模块，为后续扩展增加了无限可能。

我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

这种可控感让我开始敢把更多东西交给它，因为它记错了你能找到，你找到了就能修正。

某种意义上，一个项目最好的 AI 搭档，不是最聪明的那个，而是跟你这个项目一同成长的那个。

第二个：智能路由。

做跑团这件事，外人看起来是写一版剧情就够了。但做过的人知道，能开桌的模组是测出来的。

规则测一遍，数值测一遍，剧情分支测一遍，角色卡测一遍，边界情况再测一遍。一轮又一轮。

但这里面的任务，难度是不均质的。

设计我爱罗决战的情绪转折：需要理解角色关系、剧情张力、玩家选择和战斗节奏的平衡。这事得用最强的模型来盘，省不得。

但检查角色卡格式是不是统一、复核技能列表有没有遗漏、整理内测报告、测试某个 DC 值是否过高，这些任务就没必要每次都调动最强算力。

PilotDeck 的智能路由会自动匹配任务难度：复杂的创意判断走强模型，规则检查、格式整理、重复测试走便宜的子 Agent。成本能省 70% 到 90% 以上。

我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

这其实是一件很现实的事。

长周期创作，你不可能只用一两次 AI。你会在一个项目里反复用、连续用、大量用。如果每一次都拉满最强模型硬跑，项目越认真，成本就越膨胀。膨胀到你不敢继续。

这也是很多好的项目最终烂尾的真正原因：做好实在太贵了。

智能路由的价值不在于省，而在于让你敢反复测试。

第三个：Always-on。

这可能是让我最震撼的一个功能。

说起来你们可能不信，有一天晚上，我发现火影跑团缺一张世界地图。我跟 PilotDeck 说了，然后去睡觉。

第二天早上打开一看。

世界地图有了，但不止是世界地图。

下面还有一行说明：「光有世界地图还不够，真正开桌时，玩家每进入关键场景需要更细的小地图。我已为以下场景生成详细小地图：木叶村、中忍考试会场、波之国大桥、死亡森林、终末之谷。」

每个场景一个小地图文件，安安静静地躺在项目文件夹里。

我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

太特么震撼了，我宣布，这是我用 agent 以来的 Aha moment！

这是一种奇怪的感觉。就好像你给同事交代了一个任务，第二天发现他不光做了你交代的，还把相关的事全都搞定了，而且还是在你睡觉的时候。

PilotDeck 的 Always-on 不只是后台定时跑任务。

它是一个完整的执行链路：发现潜在任务，产出执行计划，开始执行，执行完成，产出报告，落地成果文件。

我让它测一个战斗，它会顺带检查其他关键战斗是否也有同样的问题。我让它修一段剧情，它会发现 DM 手册里的时间表也需要同步更新。

我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

我让它做世界地图，它会想到场景小地图不够。从发现缺一张世界地图开始，到每个关键场景的小地图全部吭哧吭哧给做出来了。

我让PilotDeck做了个火影跑团桌游，它竟然半夜睡醒自己加班干！

它不再是一个你问一句它答一句的聊天框。

它变成了项目里一个一直在的观察者和执行者。你吃饭的时候它在干，你看剧的时候它在干，你睡觉的时候它还在干。

实战检验：约兄弟，开团

成品出来后我约了三个朋友开团，一个当鸣人，一个当佐助，一个当小樱。

说实话开团前心里有点虚，毕竟模组是在 AI 协助下做出来的。

结果跑了两章，铃铛测试和波之国，全程没有翻车。

佐助单刷卡卡西大失败被千年杀送进土里的时候全场笑到拍桌子，鸣人听完卡卡西的教训自己站起来即兴了一段台词，我鸡皮疙瘩都起来了。

波之国再不斩登场，小樱侦查骰投了个 3 什么都没发现，再不斩突然从身后出现，那哥们直接从椅子上弹起来。

跑完问他们感觉怎么样。当鸣人的说，这是他第一次觉得自己不是在玩规则，而是在玩角色。当佐助的说，下周还来不来他要把再不斩打赢。当小樱的说最牛的地方是，每一个选择都有后果但每一个后果都不是死路。

你的兄弟们坐在桌边，在你的世界里，玩到不想回家。这种感觉，比早上起来发现活被 AI 干完了还要上头。

我把整个游戏物料放在这个飞书文档里了，对跑团感兴趣的同学可以去玩玩看，也欢迎反馈修改意见：

my.feishu.cn/wiki/TfpZwviLgitFBVkytNvcA5rln7c

结语

我后来一直在想，我的火影跑团到底是谁做的。

当然是我做的。所有关于火影的理解、关于剧情的编排、关于角色关系的判断、关于什么叫有火影味的感觉，这些东西 AI 代替不了。

但那些海量的规则检验、格式整理、缺口发现、进度推进、文件落地，如果没有 PilotDeck 一直在那个 WorkSpace 里待着，我大概率坚持不到最后。

一个能开桌的跑团，不是写出来的。是持续推进出来的。

而 PilotDeck 提供的，正是这种持续。

所以回到开头那个问题：AI 能不能不只是回消息，而是做项目？

PilotDeck 给出的答案是：可以的。前提是它得有记忆、能看见、会判断、敢主动。

记忆让它不会忘。白盒让你能纠偏。路由让你敢频繁用。Always-on 让项目在你离线时也在生长。

这些东西单拎出来可能不觉得多特别，但合在一起，你会发现 AI 的工作方式变了。

从一个你招呼一声才动一下的客服，变成了一个留在项目里、一直在推进的搭档。

它不是我一个人的作品。

但它确确实实，是因我而生的。

这种感觉，大概就是协作的本来意思吧。

所以如果你也有一个压在心底很久的想法，不管是做桌游、写小说、做产品文档还是搞任何需要长期推进的创作项目，我的建议是，给它一个完整的项目让它干起来。

对了，一定一定要开 Always-on，它会给你带来惊喜的。

GitHub 链接：https://github.com/OpenBMB/PilotDeck

官方网站链接：https://pilotdeck.openbmb.cn

文章来自于微信公众号 "网罗灯下黑"，作者 "网罗灯下黑"

关键词: AI新闻 , PilotDeck , PilotDeck实测 , PilotDeck测评

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md