我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!
8392点击    2026-05-28 17:52

玩了这么久 AI,相信大家都经常遇到过这种情况:


你跟 AI 说,帮我做一个项目。它说好的。第一版出来,你觉得还行。然后你开始修改,一轮、两轮、三轮、十轮。你发现每一轮你都在重复交代同一件事,像一个无限循环。


更崩溃的是,你把所有规则都交代完了,关掉电脑去睡觉。第二天打开一看,它停在那,特么的卡住了。。。


你不问,它不动。你在前面拉,它在后面跟。你一松手,它就原地躺平。


这就是现阶段大多数 AI 工具的真相:它们不是协作者,是响应器。


而今天,面壁智能联合清华大学、OpenBMB 开源了发布了一款新产品,叫 PilotDeck,定位很有意思:智能体协作舱。


听起来像一个空间站的名字,但本质上,它想回答一个问题:


AI 能不能不只是回消息,而是做项目?


为了试试这个问题的答案,我把一个压在心底很久的想法,丢进了 PilotDeck。


我想做一个火影跑团


事情要从上个月说起,重刷火影的时候看到鸣人蹲在秋千上,突然冒出一个念头:如果我是木叶村的忍者,我的故事会是什么样。


我是个跑团玩家,但市面上找不到好的火影模组。要么是几页设定糊弄人,要么把 DnD 规则硬套一个火影皮,完全没有那个味。找不到是吧,那我自己做一个。


对了,还是先简单解释一下跑团是什么。


它的全称叫 TRPG——桌面角色扮演游戏。你应该听过《龙与地下城》(DnD),这就是跑团的代表作。


我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!


跑团的玩法很简单:一个主持人(DM)负责讲故事、定规则、抛骰子,若干个玩家每人扮演一个角色,大家围坐在桌前,在同一个虚构世界里共同冒险。没有画面,没有特效,全凭想象力驱动。


它跟剧本杀有点像,但自由度大得多。剧本杀路线是固定的,跑团里你做什么都可以:只要 DM 同意,骰子过了,你甚至可以用嘴遁说服最终大 Boss。


但我要做的不是玩别人的跑团,我想自己做一个。


玩家从第七班成立开始,历经铃铛测试、波之国任务、中忍考试,一路推向木叶崩溃。需要完整的剧情脚本、DnD 5e 规则改编、玩家角色卡、DM 指引手册。


这可不是写一篇文章这么简单,毕竟这是一个游戏,要有很多复杂的设定,这是一个需要反复测试、迭代、修复的系统工程。


最开始,我把这个需求在其他 agent 工具上试了几次,发现一个残酷的事实:生成第一版从来不是问题的终点,它只是问题的起点。


铃铛测试里,玩家骰子一不过就卡关。再不斩的数值太强,一刀下去全员劝退。白的那场战斗只有战斗,没有情绪——角色直接废了。中忍考试每个人都单线作战,完全没有剧情交织感。最后的我爱罗决战,只能硬打,不能嘴遁。。。这还算什么火影?


就在快放弃的时候,收到面壁智能的内测邀请,我翻了翻产品逻辑,发现它想解决的问题和我当时的处境一模一样。AI 能不能不只是回消息,而是做项目。AI 能不能记住规则,能在你睡觉的时候继续干活,能自己发现你漏了什么。


我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!


我心想,那就正好拿这个项目来考验考验你,反正我向来的测试思路就是,我这两天就想做这个,就看你能不能把这事给我办成。


于是我把项目丢进了 PilotDeck。目标很明确:做一套完整能开桌的火影 TRPG 模组,玩家从第七班成立开始,经历铃铛测试、波之国任务、中忍考试,一路跑到木叶崩溃。


我先给它喂了一个 DnD 规则:


我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!


等它消化完了,然后给出任务,


帮我设计一个 10 小时左右的火影 TRPG 剧情。


我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!


然后 PilotDeck 就跑了第一版出来——


果然还是不行。


铃铛测试卡关,再不斩数值太强,白的战斗没有情绪,中忍考试各打各的,我爱罗只能硬打不能嘴遁。


我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!


三轮迭代,越改越好


但故事还没完。


PilotDeck 不一样的地方在于,你指出问题,它自己会改。


铃铛测试 DC 值不对,它重算了。再不斩一刀太强,它下调了数值还加了撤退路径。白的剧情太干,它把战斗和情绪线重新交织在一起。我爱罗那段,专门加了一套嘴遁判定规则。


我一共让它改了三轮。第一轮修数值和难度曲线,第二轮补剧情分支和情感线,第三轮做边界检查和格式统一。每一轮都是自动完成的,我把测试结论丢进去,它自己对照着改,改完自动跑测试,然后把改动摘要列出来。


最让我服气的是,上一轮改对了的东西,下一轮不会再崩回去。


中忍考试的赛制第一轮改成了单挑,后面两轮再没错过。白的情绪线第二轮补上之后,第三轮它自己在那条线上又加了两处细节。你能明显感觉到,这个项目在它手里越来越好。


我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!


三轮之后我跑了一遍完整测试,从头到尾没有明显卡点,能明显感觉到 PilotDeck 的每一次修改都长在同一个项目上,改一轮,好一轮。


PilotDeck 解决的就是这些问题,它的设计哲学很清晰:把 AI 从一个对话窗口变成一个项目工作站。


核心叫 WorkSpace:一个项目一个舱。


这个设计初看很朴素,就像一个项目管理工具。但用进去之后,你会发现它跟市面上所有 Agent 工具的差异所在。


大多数 Agent 工具的基本单位是对话。


一个 Chat,就是一个工作边界。


你问它答,窗口一多,边界就模糊了。


今天我让它写公众号,明天让它做跑团,后天做产品文档:所有东西混在一个上下文里,你甚至不知道 AI 那句离谱的回答是从哪个项目里串过来的。


有些产品也做了项目隔离,但本质上还是「文件夹+静态规则」。


你把文件放进去,把规则写好,但记忆是可见的吗?是可以追溯的吗?成本能归因到具体任务吗?技能会随着项目推进而进化吗?


这些问题,PilotDeck 给出了不同的答案。


三个最深的印象


用火影跑团这个项目,我依次讲三个让我印象最深的地方。


第一个:记忆白盒化。


做跑团最怕什么?不是 AI 写得不好,是它今天记得,明天忘了。


我的火影跑团有很多不能丢的规则:基于 DnD 5e 的 d20 判定系统,玩家必须有高光时刻,失败不能截断剧情,而应该生出新分支,再不斩要强,但要给玩家留撤退路径,白的战斗要保留情感张力,我爱罗必须允许嘴遁成立。


这些规则如果用普通 AI 工具维护,你会变成一个人肉复读机。每一次新对话,你都得重新交代一遍。交代到第三十遍,你就会开始怀疑自己到底在干嘛。


PilotDeck 的 Memory 分了两层:Project Memory 记录项目目标、进度和限制条件;Feedback Memory 沉淀你的偏好和每一次修正反馈。这些记忆不是飘在对话里的,是固化成项目资产了。


更重要的是,你能看见它记了什么。


这个细节,用过的都懂。


AI 的记忆向来是个黑盒。它好像记住了什么,但你不知道到底是什么。它某天突然按一个诡异的方向回答你,你想破脑袋也不知道是哪句话种下的因果。你想纠偏,但连定位都做不到。


PilotDeck 的项目记忆是白盒的。可以查看、可以编辑、可以删除。


我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!


例如我增加了团藏的 boss 战项目,可以在记忆里追加或编辑这个项目的设定,就好比可以打上各式各样的补丁,让整个跑团可以插进更多的模块,为后续扩展增加了无限可能。


我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!


这种可控感让我开始敢把更多东西交给它,因为它记错了你能找到,你找到了就能修正。


某种意义上,一个项目最好的 AI 搭档,不是最聪明的那个,而是跟你这个项目一同成长的那个。


第二个:智能路由。


做跑团这件事,外人看起来是写一版剧情就够了。但做过的人知道,能开桌的模组是测出来的。


规则测一遍,数值测一遍,剧情分支测一遍,角色卡测一遍,边界情况再测一遍。一轮又一轮。


但这里面的任务,难度是不均质的。


设计我爱罗决战的情绪转折:需要理解角色关系、剧情张力、玩家选择和战斗节奏的平衡。这事得用最强的模型来盘,省不得。


但检查角色卡格式是不是统一、复核技能列表有没有遗漏、整理内测报告、测试某个 DC 值是否过高,这些任务就没必要每次都调动最强算力。


PilotDeck 的智能路由会自动匹配任务难度:复杂的创意判断走强模型,规则检查、格式整理、重复测试走便宜的子 Agent。成本能省 70% 到 90% 以上。


我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!


这其实是一件很现实的事。


长周期创作,你不可能只用一两次 AI。你会在一个项目里反复用、连续用、大量用。如果每一次都拉满最强模型硬跑,项目越认真,成本就越膨胀。膨胀到你不敢继续。


这也是很多好的项目最终烂尾的真正原因:做好实在太贵了。


智能路由的价值不在于省,而在于让你敢反复测试。


第三个:Always-on。


这可能是让我最震撼的一个功能。


说起来你们可能不信,有一天晚上,我发现火影跑团缺一张世界地图。我跟 PilotDeck 说了,然后去睡觉。


第二天早上打开一看。


世界地图有了,但不止是世界地图。


下面还有一行说明:「光有世界地图还不够,真正开桌时,玩家每进入关键场景需要更细的小地图。我已为以下场景生成详细小地图:木叶村、中忍考试会场、波之国大桥、死亡森林、终末之谷。」


每个场景一个小地图文件,安安静静地躺在项目文件夹里。


我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!


太特么震撼了,我宣布,这是我用 agent 以来的 Aha moment!


这是一种奇怪的感觉。就好像你给同事交代了一个任务,第二天发现他不光做了你交代的,还把相关的事全都搞定了,而且还是在你睡觉的时候。


PilotDeck 的 Always-on 不只是后台定时跑任务。


它是一个完整的执行链路:发现潜在任务,产出执行计划,开始执行,执行完成,产出报告,落地成果文件。


我让它测一个战斗,它会顺带检查其他关键战斗是否也有同样的问题。我让它修一段剧情,它会发现 DM 手册里的时间表也需要同步更新。


我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!


我让它做世界地图,它会想到场景小地图不够。从发现缺一张世界地图开始,到每个关键场景的小地图全部吭哧吭哧给做出来了。


我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!


它不再是一个你问一句它答一句的聊天框。


它变成了项目里一个一直在的观察者和执行者。你吃饭的时候它在干,你看剧的时候它在干,你睡觉的时候它还在干。


实战检验:约兄弟,开团


成品出来后我约了三个朋友开团,一个当鸣人,一个当佐助,一个当小樱。


说实话开团前心里有点虚,毕竟模组是在 AI 协助下做出来的。


结果跑了两章,铃铛测试和波之国,全程没有翻车。


佐助单刷卡卡西大失败被千年杀送进土里的时候全场笑到拍桌子,鸣人听完卡卡西的教训自己站起来即兴了一段台词,我鸡皮疙瘩都起来了。


波之国再不斩登场,小樱侦查骰投了个 3 什么都没发现,再不斩突然从身后出现,那哥们直接从椅子上弹起来。


跑完问他们感觉怎么样。当鸣人的说,这是他第一次觉得自己不是在玩规则,而是在玩角色。当佐助的说,下周还来不来他要把再不斩打赢。当小樱的说最牛的地方是,每一个选择都有后果但每一个后果都不是死路。


你的兄弟们坐在桌边,在你的世界里,玩到不想回家。这种感觉,比早上起来发现活被 AI 干完了还要上头。


我把整个游戏物料放在这个飞书文档里了,对跑团感兴趣的同学可以去玩玩看,也欢迎反馈修改意见:


my.feishu.cn/wiki/TfpZwviLgitFBVkytNvcA5rln7c


结语


我后来一直在想,我的火影跑团到底是谁做的。


当然是我做的。所有关于火影的理解、关于剧情的编排、关于角色关系的判断、关于什么叫有火影味的感觉,这些东西 AI 代替不了。


但那些海量的规则检验、格式整理、缺口发现、进度推进、文件落地,如果没有 PilotDeck 一直在那个 WorkSpace 里待着,我大概率坚持不到最后。


一个能开桌的跑团,不是写出来的。是持续推进出来的。


而 PilotDeck 提供的,正是这种持续。


所以回到开头那个问题:AI 能不能不只是回消息,而是做项目?


PilotDeck 给出的答案是:可以的。前提是它得有记忆、能看见、会判断、敢主动。


记忆让它不会忘。白盒让你能纠偏。路由让你敢频繁用。Always-on 让项目在你离线时也在生长。


这些东西单拎出来可能不觉得多特别,但合在一起,你会发现 AI 的工作方式变了。


从一个你招呼一声才动一下的客服,变成了一个留在项目里、一直在推进的搭档。


它不是我一个人的作品。


但它确确实实,是因我而生的。


这种感觉,大概就是协作的本来意思吧。


所以如果你也有一个压在心底很久的想法,不管是做桌游、写小说、做产品文档还是搞任何需要长期推进的创作项目,我的建议是,给它一个完整的项目让它干起来。


对了,一定一定要开 Always-on,它会给你带来惊喜的。


GitHub 链接:https://github.com/OpenBMB/PilotDeck


官方网站链接:https://pilotdeck.openbmb.cn


文章来自于微信公众号 "网罗灯下黑",作者 "网罗灯下黑"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md