这两年一直在关注 AI,Claude Code 给我带来的震撼,和当初 Nano Banana 在画图领域的革命,几乎是一个级别。
Andrej Karpathy 在他的年终盘点里,称 Claude Code 是「第一个真正像 Agent 的 LLM 应用」你就能明白这玩意的含金量有多高。
先给没使用过 Claude Code 的朋友们解释一下,Claude Code 是 Anthropic 公司推出的一款 AI 编程助手工具,不仅能回答问题,还能真正调用电脑中的各种工具来执行任务,例如操作应用程序、处理文档、编写代码等。

借着这次元旦假期,我按照网上的教程,在 Cursor 里装好了 Claude Code。
我本身没有任何代码经验,装的过程基本就是:
出问题就把报错丢给 Cursor 里的 AI,让它来解决,一小时左右就搞定了。
上手体验了一下午的 Claude Code 以后,我有一种非常强烈、甚至难以言表的感觉。
打个比方的话,就像一个不会武功的人,突然得到了绝世神兵,却只能用它来劈柴。
在官方文档中,Claude Code 被描述为是一个「住在电脑里的 AI 编程助手」,能读项目、提方案、改代码、跑命令,甚至参与 Git 流程,但在我手中,它却只能做些小打小闹的粗活。
尽管如此,Claude Code 带给我的惊喜依然不少,甚至让我一度兴奋地睡不着觉,如果让我自己来定义,我会说,Claude Code 把传统的问答式 AI 和电脑里的各种工具绑在了一起,更像是一个能理解你意图的 Agent 助手。
下面,我用 3 个实际场景,尽量让你具象地感受一下:它和普通 AI 的区别到底在哪。
第一个实验任务,是让 Claude Code 帮我写一份年终汇报 PPT。
这件事表面上很普通,任何一个大模型都能给你写「年终报告大纲」,甚至按页帮你写出「第一页写什么、第二页写什么」。
但 Claude Code 不一样的地方在于:
它不是在云端帮你生成一个文件链接,而是在你电脑上的 Keynote 里,从空白页开始,把 PPT 一页页做出来。
打开终端,输入 claude 就可以启动 Claude Code,别被这个终端的样子吓到,你只需要用自然语言就可以完成任务,一行代码都不用输入。

在我下达命令后,Claude Code 先给出几种实现方案,问我希望用什么工具、什么风格。
我确认之后,它开始在后台操作:
接下来几分钟,我就看着自己的屏幕像被远程操控了一样:空白的 Keynote 被打开,一页页标题、要点、排版慢慢填上去,时不时还换个布局、微调文字位置。
最后,这个过程生成了一份 10 多页的 PPT。

它的观感老实说还算不上精致,更像一份结构还可以的草稿。但对我来说,有一点是最关键的,整个过程完全发生在我的电脑上,所有操作都是可见的、可打断的。
这说明 Claude Code 作为桌面级 Agent 工具,确实能够调用其他工具,并准确理解和执行任务。
第二个任务,是让 Claude Code 根据我的个人笔记文件,来分析我的性格特点。
这个任务,对传统 AI 来说并不算难:
你把几段文字丢给它,让它总结性格特点、工作风格、优劣势,基本都能完成。
Claude Code 和普通大模型的差别,在于它处理「上下文」的方式:
在这个任务中,我把有关于我的资料都打包成了不同的 zip 压缩文件,放到一个文件夹中,我给的提示词是:阅读关于我的文档内容,并整理出一份跟我性格特征、工作风格相关的 md 分析文件。
Claude Code 接受到指令后,首先是很聪明地将压缩文件解压了,然后逐一查看内容,并输出了 3000 字左右的文档,内容和格式都是按照我的指令严格执行的。

在这个任务中,Claude Code 自己完美地搞定「读取、解压、遍历」这一整套脏活累活,而且几乎都能把这套东西稳定地重复执行,而不是每次都要我手动喂文件,可以说完全达到了生产力工作流的级别。
让我相当满意,这能节省多少时间,打工人自然会懂。
第三个任务,是让 Claude Code 在滴答清单中添加一个提醒事项。
这个任务才真正让我感到 Claude Code 的强大和可扩展性。
在开头我给的提示词很简单:在滴答清单中新增一项任务:明天中午12点公司开会,标签:个人,优先级:高。
Claude Code 理解完需求之后,先给了两种实现方案:
它还很贴心地解释了一下:
如果你希望以后能完全自动化、组合出更多复杂操作,用 API 令牌是更合适的。
于是我选择了第一种,并把自己的 API key 提供给它,有意思的地方来了。
接下来我看到的全过程,很像一个有经验的工程师在排查问题:
它先尝试用标准方式带上 API Token 去调用接口,但失败了。
于是它改为先获取项目列表,来验证是不是网络 / 鉴权问题,还是失败了。
接下来,它推断问题出在鉴权方式上,于是开始尝试各种不同的验证方式,但均以失败告终。
按照过往的经验,这种情况下 AI 要么就放弃,要么开始无意义地重复尝试。
但这一次,Claude Code (下文简称 CC )做了一件让我有点后背发凉的事:
它自己打开浏览器,开始搜索「滴答清单 API 的详细用法」,浏览 CSDN、掘金上的帖子,最终从人类写的经验里找到了正确的调用方法。

几分钟之后,它用刚刚学到的新方法,成功在滴答清单里创建了这条任务。
我打开滴答清单一看:
任务在那儿,时间、标签、优先级都按我一开始的自然语言设好了,对工具的利用相当准确。
接下来,我决定给 CC 上点强度,在这个任务的基础上,看 CC 能多大程度上调用滴答清单的功能,我给出了新的提示词:后天我要去参加一场比赛,时间:中午12:30,标签:个人,优先级:高,四象限:紧急不重要,重复性:每周二三都提醒我一次。
不出意外,CC通过前面的学习,已经知道了添加任务的正确方式,但这一次新增了两个设置,四象限和重复性,它能否学会?
很快,我看到为了完成接下来的任务,CC 又开始尝试不同的方式并浏览网页学习添加方法,不过这一次没有成功,虽然任务是添加上了,但在象限和重复性上都没有设置成功,CC自己也发现了 API 响应不对,提醒我检查。
因为测试的时间比较长了,我也就没有再深究,但是我突然想到另一件事,CC 现在是学会添加任务了,可是下一次重新打开终端的时候,CC会不会又跟我玩失忆?如果每次开始新任务它都会遗忘,那效率也太低了。
于是我问了一嘴:如果我关掉这个终端,你下次是不是会遗忘这个滴答清单的配置?如果是的话,我要如何才能确保每次打开新的终端,都能确保你能记住这条规则。
CC 非常诚实地说了是,并建立了一个本地配置文件,以后一旦我说读取滴答清单配置文件,CC 就能立即恢复配置并添加任务。
为了测试,我关掉终端又试了一下,果然,成功了。
CC 成功地记住了这个文件里的技能,实际上,这种类似的文件也被称为 Skill,也就是用一套特定的流程,保证 CC 每次都能稳定地输出技能而不会遗忘,这意味着随着你的改变和记忆更新,CC 会变成一个掌握无穷多技能能力的 AI ,而不同的 Skill 在 github、官网上已经有很多资源,可以免费下载。
这是一件多么有想象力的事情。
可以说,CC 给我的震撼,丝毫不亚于在我心中投下了一枚原子弹。
它揭示了一种未来的工作方式,你所有的要求都可以在一个对话框中实现,无论是生成 PPT、加任务,写一个程序,真的只需要一个对话框便足以实现。
这意味着以后大部分的 App 和工具都会消失,隐藏在幕后,只需要在关键时刻让人类接管即可,甚至不用再接管,人类只需要做出价值判断,一个简单的对话框,哪怕在你睡觉的时候,AI都能完成你想要完成的事情,生产力将迎来指数级的暴增。
这是最好的时代,也是最坏的时代。
没人知道 AI 发展下去,会带来什么, 就连创造它们的人同样如此,杰弗里辛顿说,AI 可能会接管人类社会,Minimax CEO 阎俊杰在接受罗永浩采访时说,自己造出一个更强大的工具,却感到更加害怕。
其实,没人知道真相是什么,或者说,大部分人还不知道是什么。
我现在已经不再去想未来,因为我的想象力太过有限,过于想要掌握那些确定性的东西,反而徒增烦恼,不如现在开始,从自己感兴趣的东西入手,预测未来的最好方式就是自己创造未来。
所以现在我正在捣鼓 CC 的其他使用方式,为此我已经准备开始学氛围编程了,如果你也有兴趣,可以点个关注,以后会在这里更新更多 CC 的使用方法、AI 工具和氛围编程,从零开始学会一个新工具,并分享到这里。
因为这些编程工具的出现,这个世界变得前所未有地精彩。每个人的口袋里都装着一台全能的计算设备,每个人都有可能改变世界。
文章来自于“奶牛包”,作者 “奶牛包”。
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0