Claude Code 实战一下午:它到底比普通大模型多做了什么?

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Claude Code 实战一下午:它到底比普通大模型多做了什么?
6032点击    2026-01-07 10:12

这两年一直在关注 AI,Claude Code 给我带来的震撼,和当初 Nano Banana 在画图领域的革命,几乎是一个级别。


Andrej Karpathy 在他的年终盘点里,称 Claude Code 是「第一个真正像 Agent 的 LLM 应用」你就能明白这玩意的含金量有多高。


先给没使用过 Claude Code 的朋友们解释一下,Claude Code 是 Anthropic 公司推出的一款 AI 编程助手工具,不仅能回答问题,还能真正调用电脑中的各种工具来执行任务,例如操作应用程序、处理文档、编写代码等。


Claude Code 实战一下午:它到底比普通大模型多做了什么?


借着这次元旦假期,我按照网上的教程,在 Cursor 里装好了 Claude Code。


我本身没有任何代码经验,装的过程基本就是:


出问题就把报错丢给 Cursor 里的 AI,让它来解决,一小时左右就搞定了。


上手体验了一下午的 Claude Code 以后,我有一种非常强烈、甚至难以言表的感觉。


打个比方的话,就像一个不会武功的人,突然得到了绝世神兵,却只能用它来劈柴。


在官方文档中,Claude Code 被描述为是一个「住在电脑里的 AI 编程助手」,能读项目、提方案、改代码、跑命令,甚至参与 Git 流程,但在我手中,它却只能做些小打小闹的粗活。


尽管如此,Claude Code 带给我的惊喜依然不少,甚至让我一度兴奋地睡不着觉,如果让我自己来定义,我会说,Claude Code 把传统的问答式 AI 和电脑里的各种工具绑在了一起,更像是一个能理解你意图的 Agent 助手。


下面,我用 3 个实际场景,尽量让你具象地感受一下:它和普通 AI 的区别到底在哪。


Claude Code 的三个使用场景


第一个实验任务,是让 Claude Code 帮我写一份年终汇报 PPT。


这件事表面上很普通,任何一个大模型都能给你写「年终报告大纲」,甚至按页帮你写出「第一页写什么、第二页写什么」。


但 Claude Code 不一样的地方在于:


它不是在云端帮你生成一个文件链接,而是在你电脑上的 Keynote 里,从空白页开始,把 PPT 一页页做出来。


打开终端,输入 claude 就可以启动 Claude Code,别被这个终端的样子吓到,你只需要用自然语言就可以完成任务,一行代码都不用输入。


Claude Code 实战一下午:它到底比普通大模型多做了什么?


在我下达命令后,Claude Code 先给出几种实现方案,问我希望用什么工具、什么风格。


我确认之后,它开始在后台操作:


  • 打开 Keynote
  • 创建空白文稿
  • 按页添加标题、正文、排版样式


接下来几分钟,我就看着自己的屏幕像被远程操控了一样:空白的 Keynote 被打开,一页页标题、要点、排版慢慢填上去,时不时还换个布局、微调文字位置。


最后,这个过程生成了一份 10 多页的 PPT。


Claude Code 实战一下午:它到底比普通大模型多做了什么?


它的观感老实说还算不上精致,更像一份结构还可以的草稿。但对我来说,有一点是最关键的,整个过程完全发生在我的电脑上,所有操作都是可见的、可打断的。


这说明 Claude Code 作为桌面级 Agent 工具,确实能够调用其他工具,并准确理解和执行任务。


第二个任务,是让 Claude Code 根据我的个人笔记文件,来分析我的性格特点。


这个任务,对传统 AI 来说并不算难:


你把几段文字丢给它,让它总结性格特点、工作风格、优劣势,基本都能完成。


Claude Code 和普通大模型的差别,在于它处理「上下文」的方式:


  • 它可以在一个指定的文件夹里执行任务
  • 这意味着:它天然知道「任务上下文」包含哪些文件、不用你一份份复制粘贴


在这个任务中,我把有关于我的资料都打包成了不同的 zip 压缩文件,放到一个文件夹中,我给的提示词是:阅读关于我的文档内容,并整理出一份跟我性格特征、工作风格相关的 md 分析文件。


Claude Code 接受到指令后,首先是很聪明地将压缩文件解压了,然后逐一查看内容,并输出了 3000 字左右的文档,内容和格式都是按照我的指令严格执行的。


Claude Code 实战一下午:它到底比普通大模型多做了什么?


在这个任务中,Claude Code 自己完美地搞定「读取、解压、遍历」这一整套脏活累活,而且几乎都能把这套东西稳定地重复执行,而不是每次都要我手动喂文件,可以说完全达到了生产力工作流的级别。


让我相当满意,这能节省多少时间,打工人自然会懂。


第三个任务,是让 Claude Code 在滴答清单中添加一个提醒事项。


这个任务才真正让我感到 Claude Code 的强大和可扩展性。


在开头我给的提示词很简单:在滴答清单中新增一项任务:明天中午12点公司开会,标签:个人,优先级:高。


Claude Code 理解完需求之后,先给了两种实现方案:


  1. 用 API 令牌(完全自动化)
  2. 用 URL 方案(半自动)


它还很贴心地解释了一下:


如果你希望以后能完全自动化、组合出更多复杂操作,用 API 令牌是更合适的。


于是我选择了第一种,并把自己的 API key 提供给它,有意思的地方来了。


接下来我看到的全过程,很像一个有经验的工程师在排查问题:


它先尝试用标准方式带上 API Token 去调用接口,但失败了。


于是它改为先获取项目列表,来验证是不是网络 / 鉴权问题,还是失败了。


接下来,它推断问题出在鉴权方式上,于是开始尝试各种不同的验证方式,但均以失败告终。


按照过往的经验,这种情况下 AI 要么就放弃,要么开始无意义地重复尝试。


但这一次,Claude Code (下文简称 CC )做了一件让我有点后背发凉的事:


它自己打开浏览器,开始搜索「滴答清单 API 的详细用法」,浏览 CSDN、掘金上的帖子,最终从人类写的经验里找到了正确的调用方法。


Claude Code 实战一下午:它到底比普通大模型多做了什么?


几分钟之后,它用刚刚学到的新方法,成功在滴答清单里创建了这条任务。


我打开滴答清单一看:


任务在那儿,时间、标签、优先级都按我一开始的自然语言设好了,对工具的利用相当准确。


接下来,我决定给 CC 上点强度,在这个任务的基础上,看 CC 能多大程度上调用滴答清单的功能,我给出了新的提示词:后天我要去参加一场比赛,时间:中午12:30,标签:个人,优先级:高,四象限:紧急不重要,重复性:每周二三都提醒我一次。


不出意外,CC通过前面的学习,已经知道了添加任务的正确方式,但这一次新增了两个设置,四象限和重复性,它能否学会?


很快,我看到为了完成接下来的任务,CC 又开始尝试不同的方式并浏览网页学习添加方法,不过这一次没有成功,虽然任务是添加上了,但在象限和重复性上都没有设置成功,CC自己也发现了 API 响应不对,提醒我检查。


因为测试的时间比较长了,我也就没有再深究,但是我突然想到另一件事,CC 现在是学会添加任务了,可是下一次重新打开终端的时候,CC会不会又跟我玩失忆?如果每次开始新任务它都会遗忘,那效率也太低了。


于是我问了一嘴:如果我关掉这个终端,你下次是不是会遗忘这个滴答清单的配置?如果是的话,我要如何才能确保每次打开新的终端,都能确保你能记住这条规则。


CC 非常诚实地说了是,并建立了一个本地配置文件,以后一旦我说读取滴答清单配置文件,CC 就能立即恢复配置并添加任务。


为了测试,我关掉终端又试了一下,果然,成功了。


CC 成功地记住了这个文件里的技能,实际上,这种类似的文件也被称为 Skill,也就是用一套特定的流程,保证 CC 每次都能稳定地输出技能而不会遗忘,这意味着随着你的改变和记忆更新,CC 会变成一个掌握无穷多技能能力的 AI ,而不同的 Skill 在 github、官网上已经有很多资源,可以免费下载。


这是一件多么有想象力的事情。


从Claude Code 上看到未来的工作方式


可以说,CC 给我的震撼,丝毫不亚于在我心中投下了一枚原子弹。


它揭示了一种未来的工作方式,你所有的要求都可以在一个对话框中实现,无论是生成 PPT、加任务,写一个程序,真的只需要一个对话框便足以实现。


这意味着以后大部分的 App 和工具都会消失,隐藏在幕后,只需要在关键时刻让人类接管即可,甚至不用再接管,人类只需要做出价值判断,一个简单的对话框,哪怕在你睡觉的时候,AI都能完成你想要完成的事情,生产力将迎来指数级的暴增。


这是最好的时代,也是最坏的时代。


没人知道 AI 发展下去,会带来什么, 就连创造它们的人同样如此,杰弗里辛顿说,AI 可能会接管人类社会,Minimax CEO 阎俊杰在接受罗永浩采访时说,自己造出一个更强大的工具,却感到更加害怕。


其实,没人知道真相是什么,或者说,大部分人还不知道是什么。


我现在已经不再去想未来,因为我的想象力太过有限,过于想要掌握那些确定性的东西,反而徒增烦恼,不如现在开始,从自己感兴趣的东西入手,预测未来的最好方式就是自己创造未来。


所以现在我正在捣鼓 CC 的其他使用方式,为此我已经准备开始学氛围编程了,如果你也有兴趣,可以点个关注,以后会在这里更新更多 CC 的使用方法、AI 工具和氛围编程,从零开始学会一个新工具,并分享到这里。


因为这些编程工具的出现,这个世界变得前所未有地精彩。每个人的口袋里都装着一台全能的计算设备,每个人都有可能改变世界。


文章来自于“奶牛包”,作者 “奶牛包”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0