最近很多朋友问我用什么笔记软件。
我说 Obsidian。

对方停了一秒,然后说:「哦,哥们装过,后来删了,差点儿意思。」
几乎是所有接触过 Obsidian 的人,最后给我的统一答案:要么「装过,删了」,要么「放在那吃灰,一直没搞懂」,要么「用了几天觉得太复杂,卸载了」。
其中一个主要原因是:大家使用 Obsidian 的时间点是在「AI 时代」之前,而现在,Claude Code 时代下的 Obsidian 已经完全完全成了「最强笔记软件」。
有人可能会猜,我这么说是因为「它功能多」。
完全不是这样。
功能多的工具多了去了。Notion 比它功能多而且好看,飞书比它门槛更低,很多闭源笔记软件的体验打磨都比它精细。
我继续用它,是因为它完全改变了我想事情的方式。
作为一个几乎用过所有「网红」笔记工具的人,我的判断是:
Obsidian 就是目前 AI 时代下最好用的「写作+知识库」产品,甚至我来个暴论:Obsidian 可能会干死其他所有笔记软件。
另一方面,我也看到很多社区里,大家也都在说 Obsidian 上手很困难,不懂为什么都在推荐 Obsidian。
所以,下面我总结了用 Obsidian 这段时间以来的核心经验,本来一直想写的,但如果要做成分享帖的话,需要积累很长时间的素材。
今天,我觉得时候到了。
下面分享我对于 Obsidian 完整的理解,以及 9 个从真实工作里搓出来的工作流 Skill。
首先,Obsidian 本质就是一个写作工具:

不过,里面的所有页面都被保存为本地 Markdown 文件夹。你写的每一篇笔记,都是你硬盘上真真实实的一个 .md 文件。

即便把软件删了,文件也还在,
它做的事情其实真贼简单,在这些本地 MD 文件(而这是 AI 能够理解的最好格式)之上,做一个笔记系统,整个系统里你所插入的所有文本(MD 格式)、图片、视频全部存储到本地。
其次,由于 Obsidian 是本地产品,所以:
(1)本地 Claude Code、Codex 等 CLI 能够直接与 Obsidian 进行非常方便的交互。
(2)整个开源插件生态非常丰富,所有人都在思考怎么「武装」Obsidian。
综合以上几点,Obsidian 所带来的想象力几乎是无穷的。
没有任何花活,也没有任何花架子。纯纯的「大道至简」。
但正是这个朴素的底层设计,让它在 AI 时代,突然变得跟任何一个闭源笔记软件都不一样了。
下面说一下,实际使用中,三个我感受最深的优势。
我用 Obsidian 的核心思路,可能跟别人不一样:
把它当作 Claude Code 的插件,而不是把 Claude Code 当作 Obsidian 的 AI 插件。
正如上面所说,Obsidian 跟 Claude Code 是联通的,一共有 2 种方式:
(1)终端 Claude Code
(2)Obsidian 里插件社区里,有人做了一个叫做 Claudian 的插件。
有这个思路,后面所有事情都通了。
如果你不用 AI,就别用 Obsidian,去用 Notion 或者其他花花绕绕的东西就好了。配上 AI,它的三个优势才能真正发挥出来。
(1)Obsidian 本质是个 MD 文件归档器。
这一点的好处非常大,因为 MD 文件就是 AI 能理解的最佳文档格式。
具体体现是什么:任何网站的内容、PDF、Word 文档、PPT,你直接复制,在 Obsidian 里新建一个笔记页面,粘进来就是 MD 文档了。
别看这个操作很简单,但这个流程的摩擦感,应该是所有同类型产品里最低的。
(2)DIY 能力无上限,只取决于你的想象力。
很多玩笔记工具的人,有一个需求:想把界面做得特别好看,觉得好看就是生产力。但闭源产品给你的选项就是那几个,你只能在开发团队给你的 10 个选择里面拼装,完全依赖他们的想法和灵感。
Obsidian的插件基本是纯开源的,搭配上 Claude Code 或者 Codex,这个产品就几乎完全变成了 AI 的插件。极客和独立开发者会做出大量插件,整个生态是闭源产品比不了的。
举两个我自己在用的例子:
Obsidian 本身的风格主题插件(我将字体显示和相关标题的显示风格,全部个性化了):

以及我给公众号、小红书做的排版插件(基于开源插件 Enhanced Publisher,加入一堆我个人想要的功能。):

想怎么改就怎么改。
而且,围绕着 Obsidian 插件,简中社区有大量的独立开发者。举个例子,我的好朋友,一位小红书 「Obsidian 开发博主」 @Peyote 居然做了个手写标注插件。。。可以直接在 Obsidian 里写画,建立批注,高亮关键词:

当然,这个功能在其他部分笔记软件上是原生支持的,功能本身也没有多复杂。但这个插件说明了,Obsidian 是支持「原生 DIY」的,只要有想象力,它能迅速做的比其他任何笔记软件完整的多的多。
(3)纯本地的好处是无穷的。
Obsidian 里所有文字是 Markdown 格式,但图片、动图、视频都能存进笔记,展示效果和其他写作工具没区别。
关键是这些多媒体全是本地文件,AI 能直接读整个笔记库里的所有内容,文字、图片、视频截图,全能识别。 Notion 做不到这个,它是闭源的,外面接 AI 有墙,而且 Notion AI 本身也真的不好用,做的一坨,肯定没 Claude Code 强(即便它们出了一个 Custom Agent。

还有一个更重要的区别。你在 Obsidian 写笔记,再搭配 AI Agent 能力,是完全按照你自己的思路走的,想在哪里放截图就放截图,想在哪里插录屏就插录屏,整个流程是连续的。
但如果你用 ChatGPT 网页端,你要把图片单独上传、等回复、再切回来,每一步都是摩擦力。这也是为什么我特别看好 Claude Code、Codex 这类生长于本地的工具,比网页 Agent 潜力大得多。
顺便说一下云端 Agent 这个东西,我一直觉得是个伪需求。我 99% 的时间根本用不到,Obsidian 的付费同步功能我也没开,iCloud 就足够了。
本地和云端联通的方案迟早会更成熟,强制所有文件上云这条路,走不长的。
(4)免费
最后说价格。
我一直觉得在 AI 时代,你唯一值得付费的是 AI 模型,其他的付费项目都挺扯淡的。 Obsidian 是纯免费的,它也有个同步功能要付费,但我觉得完全没必要用。
免费的好处是:省出来的钱全投到 AI 上,用更好的模型,把钱投在 AI 上,再用 AI 改造 Obsidian,这件事才算跑通了。
所以说到底,这个工具怎么用,完全取决于你的想象力。不是说它已经 AGI 了,而是在这个框架下,上限不是工具定的,是你自己定的。
下面说说如何「武装」Obsidian,以及我的真实工作流总结。
必须安装的插件(安装路径:Obsidian 应用里的插件社区,GitHub)只有一个:Claudian。

我知道很多人会去 Obsidian 社区翻插件,一装装一堆,Dataview、Calendar、Kanban、Templater……然后发现每个看起来都有用,结果都安装后,反而玩不明白了。
我现在的答案很简单:别的暂时都不用装,装这一个真的就够了。
下面说说 Claudian 是什么。
Claudian 是一个独立开发者大神做出来的 Obsidian 插件,本质上是一个桥。它把你本地运行的 Claude Code(最新版本已经支持 Codex 了),跟你的 Obsidian 库打通。

这意味着,你完全没必要跳出 Obsidian 再去调用 Claude Code。
装完 Claudian 之后,你就可以在 Obsidian 的侧边栏直接跟 Claude Code 对话,它能读你当前打开的笔记、能帮你写、能帮你改、能跑 Skills(后面会讲)。更重要的是,它能读你库里的所有文件,包括图片、视频截图这些多模态内容。
这才是 Obsidian 真正「活起来」的前提。
不少朋友来问过我,说 Skill 用起来摩擦感很强,不知道从哪下手。这半年高强度把 Skills 融进工作流之后,我总结出来一个经验:
Skill 一定要自己手搓。
拿来就用的 Skill,用起来从来都不顺。
下面 8 个 Skill,有的是我从开源项目借了灵感,有的是在别人基础上改的,但每一个都经过了手搓这个阶段,才变成了真正属于我自己的工具。
首先,我做了一个 Skill:记录器 Skill-logger,这个 Skill 是专门用来管理其他 Skill 的。
这是一切的开始。

思路大致是这样:用 Claude Code 久了,Skills 会越建越多。我自己手搓的、从开源改的、借鉴别人做出来的,加在一起可能有几十个。时间一长,自己都会忘掉某个 Skill 存不存在、叫什么名字、能干什么。
这是一个很真实的问题,不是玩笑:我有好几次,一个功能搜来搜去找不到触发方式,最后发现自己半年前已经做过一个 Skill,就是记不住了。
skill-logger 解决的就是这个。
每次我新建一个 Skill,或者对某个 Skill 做了比较大的改动,Claude Code 会自动把这个 Skill 的介绍写进 ,名称、用途、触发词、路径,格式统一,追加在文件末尾。
实际效果是,现在如果我想知道「我有没有某个功能的 Skill」,直接打开那个记录文件搜一下就行。或者在跟 Claudian 聊天的时候问它,它也能直接读这个文件告诉我答案。
笔记在管理工具,工具在更新笔记,这个小闭环,我觉得挺有意思的。
当然,会有朋友说「多此一举」,但相信我,深度用下来,你会懂这个操作的可靠性,它为后续深度优化 Skill 提供了很好的空间。
我相信大家都有一个收藏夹问题:Mark 了很多,但从来找不到。
浏览器书签里塞了几百个链接,微信收藏里存了一堆截图,手机备忘录里记了一些「等下要看」的东西,结果大部分内容等下就真的再也没看过。
obsidian-resource Skill,是我的小宝藏 Skill。
我现在的工作方式是这样的:跟 Claudian or Claude Code 聊天的过程中,只要对话里出现了有价值的内容,比如某个新工具的用法、某个我第一次听说的概念、某个值得记住的判断,我就说一句「存进来」。
Claudian 会自动把这条内容整理成格式化的笔记,加上来源、加上标签、加上归档时间,直接写进我 Obsidian 库里的 。
不需要我手动打开任何文件,不需要想「这个应该放哪个文件夹」。

每隔一段时间翻一下,会发现里面已经积累了很多当时觉得「这个有用」的东西,而且都是有结构的,可以搜索、可以引用、可以在写文章的时候直接拿来用。
这个 Skill 是我觉得最有意思、也最难描述的一个。

它的基础概念是 Karpathy 提出的,我曾经在《看完 Karpathy 的推文,我决定用 AI 给自己建一座「人生碎片 Wiki 百科」|附保姆级教程、已开源》一文中,完整演示了如何构建自己的 Wiki 百科,并将整个完整项目开源了。
需要的朋友,可以自行前往安装部署。
它主要解决了一个问题:你的笔记库、手机备忘录、电脑文件里可能已经存了很多东西,日记、读书笔记、想法碎片、对话记录。
但你根本无法完整地将其整理到一个入口里,而且,单纯的整理是索然无味的。而我做的这个项目,可以把 AI 编程写作者:

有点抽象,简单来说,就是它能够将我所有存储下来的任何内容,转化成人生碎片,根据每一条内容利用自定义的「故事框架」撰写成碎片:

最终把所有的原始笔记材料「吸收」进一个 Wikipedia 式的个人知识库。
具体来说:你运行 /wiki absorb,它会逐条读你电脑里所有的内容,包括 Obsidian 里的笔记、苹果备忘录等等,把里面提到的人、事、项目、概念,整理成一篇篇按主题组织的文章,自动建立交叉引用。
这两个 Skill 我放在一起讲,因为它们是同一个工作流里的前后两步,全部都是我个人做的。
场景是这样的。
我在 Obsidian 写完一篇文章,发给团队或者甲方在飞书里修改。对方改完发回来,可能改了二三十处,有改字的、有删段的、也有加内容的。这时候问题来了:怎么把这些改动同步回 Obsidian 的原稿?
手动对比太累,但直接覆盖又不行,因为原稿里有大量的图片嵌入、视频引用,全是 ![[图片名称.png]] 这种 Obsidian 专属格式,如果直接粘贴飞书复制来的文字,这些全部会消失。
article-diff-sync 解决的就是这个。

你把从飞书复制回来的新版文字粘给 Claudian,它会自动跟原稿对比,列出所有差异,等你确认之后分批精准替换,每一张图片、每一个视频的位置全部保留,只换文字内容。
一篇几千字的文章,全程不到两分钟。
同步完之后,下一步能够完整推送到 Notion(包括图片,而且所有的空行格式都能够保持完整),发给更多人看,或者走审批流程。这就是 notion-sync 的工作。

一句指令,Obsidian 里的笔记就完整同步过去了。加粗、高亮、引用、代码块这些格式全部保留,图片自动上传图床变成 Notion 能识别的链接,不用手动做任何处理。
这两个 Skill 串起来,就是:在 Obsidian 写 → 发出去修改 → 同步回来 → 推到 Notion,整个链路跑下来,中间不需要动手处理任何东西。
这两个放在一起,因为都跟视频有关,但解决的是两个完全不同的问题。
remotion-best-practices 是给有用 React 做程序化视频需求的人准备的。
Remotion 是一个用 React 代码生成视频的框架,很多人用它来做数据可视化动画、AI 短片、自动化视频内容。它的能力很强,但文档分散,写代码的时候经常需要查「动画怎么写」「字幕怎么同步」「FFmpeg 操作怎么接」这些问题。
Skill 原项目为:

在 Obsidian 里做好的内容,可以直接在 Claude Code 里引用,直接调用 Remotion skill 做成视频。
之前,我曾在《我用全网爆火的 Remotion Skill 全面复刻了 「小 Lin 说」的特效,它能做成什么样?|附带保姆级教程》里完整用这个 Skill 测试了一遍能力,效果还是不错的。
小 Lin 说的效果:

Remotion Skill 复刻出来的效果:

对于个体短视频博主,还需要特效的人,我个人觉得够用了,它现在也是我之后做视频必用的 Skill。
另一个 video-to-gif 则是一个高频使用、但很难描述有多好用的小工具。
场景就一个:录了屏,想放进文章,但 MP4 不能嵌进公众号,得转成 GIF。
以前我的方案是打开在线转换网站 or 买一个年费会员的 APP,上传,调试参数(GZH 后台只允许 5MB 以下的 GIF),下载,再看看质量行不行。这个流程每次都要三四分钟,非常麻烦。
现在就是一句话:告诉 Claudian 视频路径,它自动调用 video2gif.sh,检测原始帧率,生成高画质但不超过 5MB 的 GIF,直接存到本地或者 Obsidian 里。
写文章经常需要截图:某个产品的官网、某篇报道的页面、某个工具的界面。
以前的流程是:打开浏览器,找到那个网页,截图,裁剪,保存,再拖进 Obsidian,也很麻烦。
web-screenshot 把这个流程变成一步。
具体的使用方法是,在 Obsidian 里选中的一段文字、或者告诉 Claudian or Claude Code:帮我根据内容去对应的网站截图。
Claudian 就能调用 screenshot.sh,通过 thum.io 这个截图 API 拿到网页截图,直接保存成 PNG 存进库里。全程不用开浏览器、不用手动截图、不用切换窗口。
具体的思路是:

这个 Skill 最常用的场景:写文章配图。
写完一篇文章,最后还要做封面图。
这一步以前我会打开 Canva 或者 PS,选模板,填文字,调一下对齐,导出,保存。看起来很简单,但每次加起来得花十几分钟,而且容易中途被打断,一打断就不想继续了。
或者用 Lovart、即梦,AI 生图,但我总觉得非常麻烦,而且质量、风格不是很可控。
cover-image 把这个压缩到了 1 秒。
工作原理很直接:我有一张固定的封面底图模板,Skill 里配好了字体(细明体,67px)、颜色(黑色)、文字位置。每次只需要告诉 Claudian 封面要写什么字,它调用 generate.py,用 Pillow 直接把文字渲到底图上,导出 PNG 存到桌面。
「封面图:Obsidian 用法大全」 → 生成 ~
/Desktop/cover-Obsidian
用法大全
.png

思路为:

一句话,完成。
这个 Skill 对我来说最重要的,是省掉了一个会让我出戏的步骤。写完文章、想好封面文字,直接在 Obsidian 里说一句,封面就生成了,不用跳出去,不用切换工具,继续干就行。
这是一个单独用没什么特别、但跟其他 Skill 配合起来就很强的小工具。
用途只有一个:给一个视频文件和一个时间戳,截出那一帧的图。
我主要用它的场景有两个。
第一个:看视频做笔记。看到某个精彩的段落想截图,以前要拖进剪映停在那一帧、截图、导出,来来回回好几步。现在告诉 Claudian「帮我截这个视频 1 分 30 秒的画面」,直接拿到 JPG,嵌进 Obsidian 笔记里。
第二个:配合下面要说的 video-highlight-ob 使用。那个 Skill 的核心功能之一,就是批量调用 video-frames 截出一批指定时间点的画面。
2 周前,我写了一篇小爆款:《7%,智谱把杭州 OPC 三幻神的心态干崩了》,里面所有的关于一个记者视频的截图都是用这个 Skill 自动化截出来的:

整个流程,我不需要打开任何一个视频编辑软件,不需要手动截图,不需要离开 Obsidian。
所以这个看起来很基础的工具,实际上是一个更复杂工作流的底层零件。
底层工具都做到这种程度,上面的复杂 Skill 才能跑得顺。这也是为什么我说 Skills 一定要自己手搓,因为你要知道它底层在调什么、怎么调,出问题了才能修。
再来说说别的。
「哦,我装过,后来删了。」
我现在完全理解这个答案了。Obsidian 本来就不是一个装上去就会用、用了就会爱的工具。它需要你往里投入,投入时间,投入你自己的工作习惯,它才会慢慢变成一个真正属于你的东西。
上面这 9 个小工作流,不是官方给我的,是我用了很久以后,一个一个从真实的工作痛点里搓出来的。它们只是我的版本,你用起来一定要改,要改成符合你自己节奏的样子。
Skill 一定要自己手搓,这件事我在文章开头说过。现在说最后一遍。
不是因为现成的不好用。是因为当你真的搓过一遍,你才会知道这个工具在你的流程里是什么位置、能干什么、不能干什么。看别人的教程,真得不到这个。
搓过一遍之后,你会突然发现,你已经系统性地回顾了你所有的工作流,并对每一个节点出现了什么问题、什么卡点,都有了明确的认知。
这不比写日报、周报、月报,顶多了吗,兄弟萌。
这一篇太长了,累了 💤。
希望能切实帮助到大家,一起 Smile AI!
看到这里,辛苦啦。
感谢你的阅读和「在场」!
文章来自于微信公众号 "AI Humanist by杉森楠",作者 "AI Humanist by杉森楠"
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT