Claude Code 实战一下午：它到底比普通大模型多做了什么？

6444点击 2026-01-07 10:12

这两年一直在关注 AI，Claude Code 给我带来的震撼，和当初 Nano Banana 在画图领域的革命，几乎是一个级别。

Andrej Karpathy 在他的年终盘点里，称 Claude Code 是「第一个真正像 Agent 的 LLM 应用」你就能明白这玩意的含金量有多高。

先给没使用过 Claude Code 的朋友们解释一下，Claude Code 是 Anthropic 公司推出的一款 AI 编程助手工具,不仅能回答问题,还能真正调用电脑中的各种工具来执行任务,例如操作应用程序、处理文档、编写代码等。

借着这次元旦假期，我按照网上的教程，在 Cursor 里装好了 Claude Code。

我本身没有任何代码经验，装的过程基本就是：

出问题就把报错丢给 Cursor 里的 AI，让它来解决，一小时左右就搞定了。

上手体验了一下午的 Claude Code 以后，我有一种非常强烈、甚至难以言表的感觉。

打个比方的话，就像一个不会武功的人，突然得到了绝世神兵，却只能用它来劈柴。

在官方文档中，Claude Code 被描述为是一个「住在电脑里的 AI 编程助手」，能读项目、提方案、改代码、跑命令，甚至参与 Git 流程，但在我手中，它却只能做些小打小闹的粗活。

尽管如此，Claude Code 带给我的惊喜依然不少，甚至让我一度兴奋地睡不着觉，如果让我自己来定义，我会说，Claude Code 把传统的问答式 AI 和电脑里的各种工具绑在了一起，更像是一个能理解你意图的 Agent 助手。

下面，我用 3 个实际场景，尽量让你具象地感受一下：它和普通 AI 的区别到底在哪。

Claude Code 的三个使用场景

第一个实验任务，是让 Claude Code 帮我写一份年终汇报 PPT。

这件事表面上很普通，任何一个大模型都能给你写「年终报告大纲」，甚至按页帮你写出「第一页写什么、第二页写什么」。

但 Claude Code 不一样的地方在于：

它不是在云端帮你生成一个文件链接，而是在你电脑上的 Keynote 里，从空白页开始，把 PPT 一页页做出来。

打开终端，输入 claude 就可以启动 Claude Code，别被这个终端的样子吓到，你只需要用自然语言就可以完成任务，一行代码都不用输入。

Claude Code 实战一下午：它到底比普通大模型多做了什么？

在我下达命令后，Claude Code 先给出几种实现方案，问我希望用什么工具、什么风格。

我确认之后，它开始在后台操作：

打开 Keynote
创建空白文稿
按页添加标题、正文、排版样式

接下来几分钟，我就看着自己的屏幕像被远程操控了一样：空白的 Keynote 被打开，一页页标题、要点、排版慢慢填上去，时不时还换个布局、微调文字位置。

最后，这个过程生成了一份 10 多页的 PPT。

Claude Code 实战一下午：它到底比普通大模型多做了什么？

它的观感老实说还算不上精致，更像一份结构还可以的草稿。但对我来说，有一点是最关键的，整个过程完全发生在我的电脑上，所有操作都是可见的、可打断的。

这说明 Claude Code 作为桌面级 Agent 工具，确实能够调用其他工具，并准确理解和执行任务。

第二个任务，是让 Claude Code 根据我的个人笔记文件，来分析我的性格特点。

这个任务，对传统 AI 来说并不算难：

你把几段文字丢给它，让它总结性格特点、工作风格、优劣势，基本都能完成。

Claude Code 和普通大模型的差别，在于它处理「上下文」的方式：

它可以在一个指定的文件夹里执行任务
这意味着：它天然知道「任务上下文」包含哪些文件、不用你一份份复制粘贴

在这个任务中，我把有关于我的资料都打包成了不同的 zip 压缩文件，放到一个文件夹中，我给的提示词是：阅读关于我的文档内容，并整理出一份跟我性格特征、工作风格相关的 md 分析文件。

Claude Code 接受到指令后，首先是很聪明地将压缩文件解压了，然后逐一查看内容，并输出了 3000 字左右的文档，内容和格式都是按照我的指令严格执行的。

Claude Code 实战一下午：它到底比普通大模型多做了什么？

在这个任务中，Claude Code 自己完美地搞定「读取、解压、遍历」这一整套脏活累活，而且几乎都能把这套东西稳定地重复执行，而不是每次都要我手动喂文件，可以说完全达到了生产力工作流的级别。

让我相当满意，这能节省多少时间，打工人自然会懂。

第三个任务，是让 Claude Code 在滴答清单中添加一个提醒事项。

这个任务才真正让我感到 Claude Code 的强大和可扩展性。

在开头我给的提示词很简单：在滴答清单中新增一项任务：明天中午12点公司开会，标签：个人，优先级：高。

Claude Code 理解完需求之后，先给了两种实现方案：

用 API 令牌（完全自动化）
用 URL 方案（半自动）

它还很贴心地解释了一下：

如果你希望以后能完全自动化、组合出更多复杂操作，用 API 令牌是更合适的。

于是我选择了第一种，并把自己的 API key 提供给它，有意思的地方来了。

接下来我看到的全过程，很像一个有经验的工程师在排查问题：

它先尝试用标准方式带上 API Token 去调用接口，但失败了。

于是它改为先获取项目列表，来验证是不是网络 / 鉴权问题，还是失败了。

接下来，它推断问题出在鉴权方式上，于是开始尝试各种不同的验证方式，但均以失败告终。

按照过往的经验，这种情况下 AI 要么就放弃，要么开始无意义地重复尝试。

但这一次，Claude Code （下文简称 CC ）做了一件让我有点后背发凉的事：

它自己打开浏览器，开始搜索「滴答清单 API 的详细用法」，浏览 CSDN、掘金上的帖子，最终从人类写的经验里找到了正确的调用方法。

Claude Code 实战一下午：它到底比普通大模型多做了什么？

几分钟之后，它用刚刚学到的新方法，成功在滴答清单里创建了这条任务。

我打开滴答清单一看：

任务在那儿，时间、标签、优先级都按我一开始的自然语言设好了，对工具的利用相当准确。

接下来，我决定给 CC 上点强度，在这个任务的基础上，看 CC 能多大程度上调用滴答清单的功能，我给出了新的提示词：后天我要去参加一场比赛，时间：中午12:30，标签：个人，优先级：高，四象限：紧急不重要，重复性：每周二三都提醒我一次。

不出意外，CC通过前面的学习，已经知道了添加任务的正确方式，但这一次新增了两个设置，四象限和重复性，它能否学会？

很快，我看到为了完成接下来的任务，CC 又开始尝试不同的方式并浏览网页学习添加方法，不过这一次没有成功，虽然任务是添加上了，但在象限和重复性上都没有设置成功，CC自己也发现了 API 响应不对，提醒我检查。

因为测试的时间比较长了，我也就没有再深究，但是我突然想到另一件事，CC 现在是学会添加任务了，可是下一次重新打开终端的时候，CC会不会又跟我玩失忆？如果每次开始新任务它都会遗忘，那效率也太低了。

于是我问了一嘴：如果我关掉这个终端，你下次是不是会遗忘这个滴答清单的配置？如果是的话，我要如何才能确保每次打开新的终端，都能确保你能记住这条规则。

CC 非常诚实地说了是，并建立了一个本地配置文件，以后一旦我说读取滴答清单配置文件，CC 就能立即恢复配置并添加任务。

为了测试，我关掉终端又试了一下，果然，成功了。

CC 成功地记住了这个文件里的技能，实际上，这种类似的文件也被称为 Skill，也就是用一套特定的流程，保证 CC 每次都能稳定地输出技能而不会遗忘，这意味着随着你的改变和记忆更新，CC 会变成一个掌握无穷多技能能力的 AI ，而不同的 Skill 在 github、官网上已经有很多资源，可以免费下载。

这是一件多么有想象力的事情。

从Claude Code 上看到未来的工作方式

可以说，CC 给我的震撼，丝毫不亚于在我心中投下了一枚原子弹。

它揭示了一种未来的工作方式，你所有的要求都可以在一个对话框中实现，无论是生成 PPT、加任务，写一个程序，真的只需要一个对话框便足以实现。

这意味着以后大部分的 App 和工具都会消失，隐藏在幕后，只需要在关键时刻让人类接管即可，甚至不用再接管，人类只需要做出价值判断，一个简单的对话框，哪怕在你睡觉的时候，AI都能完成你想要完成的事情，生产力将迎来指数级的暴增。

这是最好的时代，也是最坏的时代。

没人知道 AI 发展下去，会带来什么，就连创造它们的人同样如此，杰弗里辛顿说，AI 可能会接管人类社会，Minimax CEO 阎俊杰在接受罗永浩采访时说，自己造出一个更强大的工具，却感到更加害怕。

其实，没人知道真相是什么，或者说，大部分人还不知道是什么。

我现在已经不再去想未来，因为我的想象力太过有限，过于想要掌握那些确定性的东西，反而徒增烦恼，不如现在开始，从自己感兴趣的东西入手，预测未来的最好方式就是自己创造未来。

所以现在我正在捣鼓 CC 的其他使用方式，为此我已经准备开始学氛围编程了，如果你也有兴趣，可以点个关注，以后会在这里更新更多 CC 的使用方法、AI 工具和氛围编程，从零开始学会一个新工具，并分享到这里。

因为这些编程工具的出现，这个世界变得前所未有地精彩。每个人的口袋里都装着一台全能的计算设备，每个人都有可能改变世界。

文章来自于“奶牛包”，作者 “奶牛包”。

关键词: AI新闻 , AI编程 , Claude Code , Claude Code 经验分享

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0