AI大神卡帕西的编程“魔法”:自曝四层工具链,Cursor主力、GPT-5兜底

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AI大神卡帕西的编程“魔法”:自曝四层工具链,Cursor主力、GPT-5兜底
5327点击    2025-08-26 12:16

最新大模型编程指南来了!


AI大神卡帕西的编程“魔法”:自曝四层工具链,Cursor主力、GPT-5兜底


智东西8月25日消息,今日,前特斯拉AI总监、OpenAI联合创始人安德烈·卡帕西(Andrej Karpathy)放出了AI辅助编程的私藏独家秘籍。


AI大神卡帕西的编程“魔法”:自曝四层工具链,Cursor主力、GPT-5兜底


▲安德烈·卡帕西部分推文截图


他的AI辅助编程不再集中于一个工具,而是“雇佣”了多个工具按需分配岗位


总结来看,卡帕西使用AI辅助编程可分为4个阶段,75%使用Cursor编辑器自动补全代码功能,其次使用大模型修改某段具体代码,第三层使用Claude Code、Codex等独立AI编程工具,实现较大功能模块;最后使用GPT-5 Pro解决最难的问题,他将GPT-5 Pro称为“最后一道防线”。


AI大神卡帕西的编程“魔法”:自曝四层工具链,Cursor主力、GPT-5兜底


▲安德烈·卡帕西AI辅助编程流程图


这是因为,当下,开发者无法基于单一编程工具满足所有开发需求,且这些工具擅长的点各有不同,包括Cursor编辑器善于自动补全代码,但需频繁重启;独立AI编程工具可以针对开发者不了解内容编程,但需要定期清理代码、调整风格、处理代码审美等;GPT-5 Pro则能处理最难的问题,10分钟分析出人类、Cursor、Claude Code都找不到的隐蔽bug。


从卡帕西分享的AI编程工作流可以看出,目前的AI编程工具各有优劣,开发者会通过拼接使用实现高效辅助编程。


01.Cursor是主力、独立AI编程工具辅助,GPT-5 Pro解决最难问题


卡帕西在推文中提到的具体工作流程如下:


他使用大模型辅助编程的流程中,有75%都用于在Cursor编辑器中通过Tab键触发的自动补全代码功能


这是因为,卡帕西发现自己在代码的正确位置写下具体的代码片段或注释,是向大模型传递“任务需求”的高效方式,也就是说,关键在于精准传递任务细节。如果用文字描述其想要实现的效果,不仅需要大量表述,还会产生明显延迟;而直接在代码里、在正确位置演示需求,速度则快得多。


但偶尔,这一自动补全功能需要他进行频繁开启、关闭才会变得好用。


AI大神卡帕西的编程“魔法”:自曝四层工具链,Cursor主力、GPT-5兜底


▲卡帕西使用Cursor编辑器的推文描述


第二层用法是:卡帕西会选中一段具体的代码,要求大语言模型对其进行某种修改


AI大神卡帕西的编程“魔法”:自曝四层工具链,Cursor主力、GPT-5兜底


▲卡帕西使用大模型修改代码的推文描述


第三层用法是,他会在Cursor编辑器之外,运行Claude Code、Codex等独立的AI编程工具。这种情况一般是,他遇到需要实现较大功能模块,且用提示词比较容易说清需求的场景。


对于这些工具的评价,卡帕西说,这些工具确实帮了大忙,但整体用下来体验有好有坏,偶尔还会让人有点烦。他不会使用“无需每一步确认模式”(YOLO mode),因为这些工具很容易跑偏,写出他根本不想要、也不需要的冗余内容,所以经常需要按ESC键中断生成。


卡帕西吐槽说,他还没学会同时用多个工具来提升效率,因为单是用好一个,就已经够费劲了。


其中的问题包括,他无法高效实现CLAUDE.md文档的维护、更新,必须经常花时间做“代码清理”、调整代码风格或者处理“代码审美”相关问题。


比如,这些AI工具写代码时防御性过强,会滥用try/catch语句;把抽象逻辑搞复杂;把代码写得臃肿冗余,很多时候用列表推导式或者一行if-else就能解决的问题,偏要写嵌套的if-else结构;重复写好几段相似代码,没有将其封装成一个简洁的辅助函数。


这些就证明AI工具没有“代码审美”的概念。


但卡帕西提到,在某些场景下,这些工具又必不可少:比如当他需要Vibe Coding(氛围编程),且对相关领域不太熟悉的时候。他提到像他最近写Rust代码、写SQL命令,或是其他平时很少接触的内容时,这些AI编程工具就能派上大用场。


他还试过让Claude Code在写代码的同时教他一些知识,但这个工具满脑子就只想写代码,不愿意花时间在过程中解释任何内容。他之前还让Claude Code帮忙做超参数调优,结果过程特别有意思,但效果并不好。


卡帕西还提到一些场景,这些工具的作用也十分突出,比如需要各种低风险一次性的自定义可视化图表、小工具或调试代码。因为这些工具过于浪费时间。他举了一个例子,为了定位某个特定bug,Claude Code能快速写出1000行专门的可视化代码或调试代码,找到bug后就可以全部删掉这些代码。


他认为,现在已经是代码过剩时代,开发者完全可以先写出成千上万行高度定制化、用完即弃的代码,代码早已不是那种“写出来就很珍贵、成本很高”的东西了。


AI大神卡帕西的编程“魔法”:自曝四层工具链,Cursor主力、GPT-5兜底


▲卡帕西使用独立AI编程工具的推文描述


最后一道防线是GPT-5 Pro。卡帕西称,他会在遇到最难解决的问题时用到它。


他提到,有很多次,他本人、Cursor编辑器、Claude Code都卡在一个bug上且10分钟都没进展,而当他把完整代码复制粘贴给GPT-5 Pro后,它花了10分钟分析,然后就找出了非常隐蔽的bug。卡帕西认为,GPT-5 Pro的能力确实很强,还能检索到各种生僻的文档、学术论文之类的资料。


对于GPT-5 Pro的其他用途,卡帕西称也会用它处理其他更复杂的任务,比如让它给代码抽象逻辑的优化提建议,但效果有好有坏,有时候能给出不错的想法,但不是所有建议都有用;或者让它围绕“某个技术的实现方法”做一次完整的文献调研,它最后会返回相关度很高的参考资料和信息来源。


总之,卡帕西认为,在众多各有优劣的工具加持下,编程领域的可能性被完全打开了。不过,这也让人很容易产生一种焦虑感,担心自己没能跟上行业集体能达到的前沿水平。也正因为如此,才有了这周日洗澡时突然冒出来的一堆想法,同时我也特别好奇,其他人在实践中都有哪些发现。


AI大神卡帕西的编程“魔法”:自曝四层工具链,Cursor主力、GPT-5兜底


▲卡帕西使用GPT-5 Pro的推文描述


02.开发者拼接编程工具,评论区为卡帕西提建议


评论区很多网友对卡帕西的工作流程表示认同,他们提到,部分工具可能有所不同,但基本都选择了拼接不同AI工作辅助编程的策略


AI大神卡帕西的编程“魔法”:自曝四层工具链,Cursor主力、GPT-5兜底


在评论区还有不少网友为卡帕西遇到的问题提建议:比如打造Context Engineer的Agent,帮助开发者更新Claude.md,或者为了避免Claude Code反复跑偏,要求它提供详细但简洁的问题总结,交给Grok解决;或者尝试语音转录说出指令等。


AI大神卡帕西的编程“魔法”:自曝四层工具链,Cursor主力、GPT-5兜底


03.结语:开发者靠工具拼接,实现高效辅助编程


越来越多的开发者使用AI工具更高效便捷编写代码,具体用例包括自动补全代码行、修复代码错误和测试代码等。


但在实际体验中,AI编程工具会面临编写错误、代码冗余等情况。从卡帕西分享的AI辅助编程流程以及评论区网友的互动可以看出,在AI编程工具发展尚处于初期,无法基于单一工具满足用户需求的情况下,开发者正通过拼接不同工具,发挥其在不同编程环节的优势,以实现高效、准确的辅助编程。


文章来自于微信公众号“智东西”,作者是“程茜”。


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
语音转录

【开源免费】Whisper是由openai出品的语音转录大模型,它可以应用在会议记录,视频字幕生成,采访内容整理,语音笔记转文字等各种需要将声音转出文字等场景中。

项目地址:https://github.com/openai/whisper

在线使用:https://huggingface.co/spaces/sanchit-gandhi/whisper-jax

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0