昨天花了两个小时,跑通了一套生成小红书图片的 Skill。先给大家看看效果。
一共做了八种风格,这里就挑几张展示。



你可能有印象,几年前网上有类似的付费工具。因为小红书正文限制一千字,超了就只能做成图片发。当时确实有人靠这个赚钱。
所以我就突发奇想,觉得用 Skill 应该能搞定这事儿。试了一下,果然很简单,把需求描述清楚,想法很快就能跑出来。

现在这个 Skill 已经装到我的龙虾里了。随时可以丢一篇文档、一个链接过去,让它读完之后按某种风格生成图片。
今天就来讲讲我是怎么做的。
本地安装 OpenClaw
最近两周,OpenClaw 相关的产品真的冒出来很多。
今天用的是朋友团队做的产品,叫 BoClaw,一家创业公司的作品。
前几天刚发布的,竟然比腾讯发布的还要早几天。我觉得他们有不少自己的想法。下载地址如下:
http://boclaw.ai
OpenClaw 的部署门槛不低,所以这款产品做的事情是在 OpenClaw 基础上做产品化,而且是本地部署。
为什么强调本地部署?因为云端部署有个天然的问题:你的文件在本地,龙虾在云上,中间隔着一层。你想让它帮你整理桌面上的文档,或者读一下本地的 PDF,就得先把文件传上去。
而本地部署的话,龙虾就跑在你自己电脑上,直接就能访问你的文件,相对也更安全。
除了这个,我觉得 BoClaw 还有几个优势。
第一是简单。它把所有该可视化的部分都可视化了。
举个例子,Skill 这个东西。之前在原生 OpenClaw 里,我们想装个 Skill,得用自然语言跟它说,有时候还得自己去 GitHub 上找地址、复制粘贴。
但在 BoClaw 里,它直接做成了一个商店界面,所有主流 Skill 都在里面,看中哪个点一下就装好了,当然也可以通过对话让 BoClaw 自己找合适的 Skill)。
养龙虾肯定会用到 Skill,这个体验提升还是很明显的。

第二是模型切换方便。之前在 OpenClaw 里想换个模型,还得改配置,或者哪怕是 Coding Plan,也得去后台改设置,反正对于普通用户来说,这一点还是太复杂。
因为大部分小白用户,连什么是 Token 都不知道。

但 BoClaw 在这儿做了集成,它搞了一个 Bocloud AI 模型,已经预置了几款常用模型,我们不需要单独买 Token,可以直接免配置使用,而且它现在有免费版,每 5 小时有 20 次免费请求额度。
对于一个创业公司来说,这个诚意相当足了,能让大家不花钱就体验到 OpenClaw 是怎么回事。
同时也支持快速配置 DeepSeek、GLM、MiniMax、Qwen 这些国内头部模型。
值得一提的是它对 IM 工具的接入,即便是本地部署,它同样可以连接到 IM。
配置和其他的龙虾一模一样。先去 IM 创建 Bot 应用,再回来把 App ID 和 Secret 填入到 BoClaw 的应用。

创建 Skill (skill-creator)
刚才演示的那个生成小红书图片的 Skill,就是在 BoClaw 里创建的。
说到这儿,我想聊一个事情。总会碰到有人说,部署好了 OpenClaw,然后不知道拿它来干嘛。全是炒作,算了不折腾了。
反正工作中,我碰到这种人,一定敬而远之。因为他很容易给自己找退路。
还有人说,别着急,龙虾晚装半年天也塌不了。道理是这个道理,但在 AI 快速变化的当下,我个人一直觉得,保持在工具链的前沿,虽然会绕一些弯路,但 ROI 一定是最高的。
就像这两个月的 OpenClaw 发展。前段时间部署成本确实高,问题也多,但我一路跟过来,眼睁睁看着技术逐步成熟和完善,收获非常多。
参与进去,看到一个产品从粗糙变得好用,这个过程本身就是一种学习。
你会知道它为什么这么设计,踩过哪些坑,适合什么场景。这些东西,等它成熟了再来用的人,是体会不到的。
我个人认为,龙虾装好之后,紧接着就应该去玩 Skill。
Skill 是什么?说白了就是把我们的经验流程抽象出来。你平时怎么做一件事,分几步,每步注意什么,把这些写成 Skill,龙虾就能照着做了。
这周,我们团队已经全员养虾了。一个同事说,他拥有 OpenClaw 之后,最大的感触是:
要重新审视一遍自己的工作流程。你每天在做的那些事情,哪些是重复性的?哪些是有固定套路的?哪些你其实已经做得很熟练,闭着眼睛都能做,但就是要花时间?
这些事情,都可以问自己一个问题:这件事真的需要我亲自做吗?有没有可能交给龙虾?
比如我做小红书图片这个 Skill,其实就是因为我发现自己经常要把长文章变成图片发出去。
流程是固定的:读文章、提炼要点、排版、生成图片。这事儿我做了好多次,套路很清楚,但每次都要花时间。那为什么不让龙虾来做呢?
想清楚这一点,你就不会觉得 OpenClaw 不知道拿来干嘛了。能干的事情太多了,关键是你愿不愿意花点时间,把自己的经验变成 Skill。
BoClaw 管这个叫个性化元能力,就是创建自己的 Skill。我简单演示下我的制作过程。
首先,输入我的 Skill 需求。这部分我就是用语音输入法表达自己的想法,最后再润色一下。
我推荐大家一定要用语音输入法,因为很多时候文字输入,会阻碍我们和 AI 的交流。毕竟文字慢,人还容易走神。

我选了 M2.5-highseed 这个模型,优点是速度快。大家看到了吧,在 BoClaw 里,我想选什么模型就在左下角选择,不需要更改配置文件,也不需要折腾 API Key。
所以,我感觉这款产品,比较适合我老婆这种非 IT 从业者。下载个安装包,就能咔咔用。
紧接着,就是创建过程了。我们在 BoClaw 的页面,会看到 AI 具体的执行情况。其实这个过程,我们完全没必要看。说完需求,等消息就好了。

为了演示,我刚是在 BoClaw 的对话框里发的请求。其实,同样可以在飞书里发类似的请求。

总之,既可以在 IM 里,也可以在 BoClaw 的客户端,和龙虾交互。看自己意愿。
等了一分多钟,它提醒我,Skill 创建好了。我迅速测试了下,还不错。不过,我希望风格能多一些,比如支持苹果的备忘录。

这时候,我在网上找了一个备忘录海报,告诉 BoClaw,我需要在 Skill 里加一个这种风格的图片。

说完指令,BoClaw 就开始干活了。我该忙啥忙啥去。
这也是龙虾类产品和过去 ChatBot 最大的区别。
Chat 是一问一答,你问一句它回一句,你得盯着屏幕等结果。但龙虾本质是 Agent,你吩咐它干活,它就自己去跑了,跑完你看结果就行,不用盯过程。
而且龙虾干活一般都需要点时间,几分钟甚至更久,你完全可以切出去干别的事。
说白了,用 Chat 像发微信,你得等对方回复。用龙虾像派活给同事,交代清楚就行了,做完他会告诉你。

不过,我点开看了下,效果没那么好。这时候怎么办?继续调呗。耐心的告诉它,整体的元素要 100% 还原,不要有偏差,不需要自己创造。

创建 Skill 的过程其实就是这样。
打个比方,把龙虾想象成一个新来的同事。他刚入职,不知道我们的流程,也不清楚我们的审美偏好,但他会干活,执行力很强。
这时候我需要做的就是一遍一遍把想法告诉他,他做一版我看看,不对的地方再纠正,直到他彻底理解我的需求。
一旦教会了,下次他就能按确定的流程来做,速度就快起来了。
磨刀不误砍柴工。如果我们不愿意花时间调教 Skill,那最后就得一次次自己干这些活。活永远在你手上,分不出去。
Skill 创建好之后,我在飞书里告诉 BoClaw。能看到,它开始查找 Docx 了。

紧接着,又问我要哪个风格:

我选择了 Apple-notes 之后,它很快生成好了图片。不过,居然放到 tmp 文件夹了。这个不方便,于是,我又告诉它,放到下载文件夹。

进一步固化到 Skill。搞定。

写在最后
写在最后,说一个我的观点。
去年 Skill 这个概念诞生的时候,我就觉得它解决了一个很难的问题:人的经验怎么传递给 AI。
这事儿说起来好像不复杂,但你仔细想想,之前我们和 AI 交互,每次都得从头说起。你的偏好、你的流程、你踩过的坑,AI 不知道,你得一遍遍重复。
Skill 用一种所有人看起来都很简单的方式,把这个问题解决了。好像这个世界上真正厉害的发明都是这样,事后看觉得理所当然,但就是得有人先想出来。
今年龙虾一下子出圈,变得一发不可收拾。国内国外,最近冒出来非常多基于龙虾的产品。
我觉得这两件事凑到一起,会让另一件事变得越来越自然:很多我们之前用的网页工具、APP 工具,可能真的没必要了。
就拿我今天做的这个小红书图片生成来说。几年前有人专门做这个功能,做成网页工具,还能收费。
用户要用的话,得打开那个网页,把文字粘贴进去,选样式,点生成,再把图片下载下来。流程不复杂,但你得专门去用它。
现在呢?我写了个 Skill,直接在龙虾里说一句话,图片就生成好了。不用跳出去,不用学怎么操作那个网页,甚至不用记得有这么个工具存在。
这就是区别。之前的工具是独立的,你得主动想起来去用它。但 Skill 是融在工作流里的,你只需要吩咐 AI 去做,它就做了。
不用打开另一个网页,不用学另一套操作逻辑,不用在不同工具之间来回切换。
再举个例子。我刚刚临时想到的。
我们公司每天都会记录昨天各个核心业务的增长数据,这事之前是我和另外一个同事负责。每人负责更新几个指标,我定了个提醒,固定时间填写。
但这事,我现在觉得,他就很琐碎。之前的工具,可以做到定时提醒,但没办法帮我们直接干了。

其实人干的话,就是打开某几个网页,复制昨天的数据,粘贴到表格里。完全没有技术含量。
刚我测试了下,用 BoClaw 完全能够跑通。

这是最后拿到的数据:

继续,让它连接 Notion,再写进去:

具体的过程我不再详述了,反正就是经过几轮的沟通之后,BoClaw 是完全可以搞定的,关键是耐住性子沟通。

比如刚才我没有告诉 AI 要写入到哪一列以及写哪个数据。确实,有的时候忘了,忘了就继续沟通嘛。彻底搞定之后,再把它沉淀为 Skill,以后就可以一直复用了。

这种场景有价值吗?也许有人会说,这也太小儿科了,没必要浪费 Token。
我是这么看的。
第一,干这种事也不需要用 Opus 4.6 这样最贵的模型,我测过的几个国产模型都足够用了。
第二,这一件事表面上只帮我省一两分钟,但更大的价值是,它省掉了一次上下文切换。
文章来自于微信公众号 “AI产品阿颖”,作者 “AI产品阿颖”
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md