编者按:vibe coding不是编程的终点,而是Context Engineering驱动的协作智能的起点。那些能够最早理解并应用这种整合视角的人,将在下一轮技术变革中获得决定性优势。
自今年2月AI研究大牛Andrej Karpathy发了那条只有185个字的推文后,整个编程界都掀起了大地震。在这条推文中,"vibe coding"首次出现在了大众视野:"总是'全部接受 Accept All',不再阅读差异,遇到错误信息就直接复制粘贴,通常就能修复"。这种看似"随意"的编程描述,立即引起了学术界的关注,剑桥大学和微软研究院的研究者敏锐地意识到这可能代表着编程范式的重大转变,决定对这一现象进行深入的学术研究。https://arxiv.org/pdf/2506.23253
剑桥大学和微软研究院的两名研究者,用完全人工肉眼分析了YouTube和Twitch上35小时的真实vibe coding视频,在这个AI泛滥的时代,这种纯人工的学术坚持堪称珍贵。他们发现,这压根不是程序员变懒了,而是编程范式的根本性转变:这种转变背后体现的是"物质脱离"(material disengagement)理论,程序员不再直接操作代码这个"物质基础",而是通过AI中介来编排代码生产。这种转变可能预示着整个知识工作领域的变化趋势,就像从手工作坊到工业化生产的转变。但与完全的自动化不同,vibe coding仍需要人类的战略思维和质量把控。
视频样本说明:研究者最终选择了5个高质量视频进行深度分析,按平台和时间顺序编号:YT15、YT18、YT21、YT22(Y--Tube视频)和TW1(Twitch视频)。这些编号将在后续分析中反复出现,代表不同的vibe coding实践案例。
研究者构建了一个精密的分析框架,将vibe coding现象分解为9个顶级维度和20个详细子类别。这个框架为理解这一新兴编程范式提供了系统性的分析工具。
Vibe Coding分析框架 - 涵盖从目标设定到表演影响的完整研究维度
应用类型的多样性光谱
研究者深入分析了vibe coding的应用范围,发现了从简单到复杂的完整光谱:
这个发现很重要,因为它证明vibe coding不只是做玩具项目的工具。
成功预期的现实主义转向
更有趣的发现是程序员对成功的预期态度呈现出明显的分化模式:
这种80-90%满意度的普遍现象,其实反映了用户对AI能力边界的逐渐认知。
初始意图的预规划特征
研究者发现,大多数创作者在开始vibe coding之前已经有了相当清晰的目标框架:
这打破了"AI驱动的完全即兴创作"的刻板印象,说明预先规划在vibe coding中依然重要。
意图精化中的"上下文动量"现象
这里出现了论文最重要的概念之一"上下文动量"。研究者观察到,AI的早期解释和输出会产生路径依赖效应,深刻影响项目后续发展。
典型案例:YT18项目中的日期选择器
这种现象既可能是限制,也可能带来意外的创新灵感,就像YT15中的动画功能就是基于现有代码结构的临时想法。
标准化的八步迭代循环
研究者通过对比所有视频,总结出了vibe coding的标准工作流程:
1.制定目标:设定目标或子目标
2.提示生成:提示模型生成代码
3.代码审查:审查生成的代码
4.决策判断:接受或拒绝更改
5.实际测试:在应用中测试更改
6.问题识别:识别错误或改进领域
7.策略调整:精化提示或转向手动调试
8.循环迭代:重复直到子目标满足
这个循环的关键特征是"迭代目标满足",每次循环都在逐步逼近最终目标,而不是一次性完成。
以AI-IDE为核心的工具生态系统
研究者详细分析了vibe coding的技术基础设施,发现了一个复杂的工具生态:
这个生态系统的复杂性说明,成功的vibe coding需要的不只是一个AI模型,而是完整的工具支持体系。
会话设置的系统性准备
研究者发现,有经验的用户会进行大量的预备工作:
这些准备工作体现了"磨刀不误砍柴工"的智慧,也说明高质量的vibe coding需要相当的前期投入。
明确提示策略的技术组合
具体的提示技术非常丰富,主要包括:
这些技术的组合使用体现了提示工程已经发展为一门相当成熟的技艺。
提示粒度的光谱式控制
研究者观察到提示粒度从极简到极详的完整光谱:
YT21的开发者明确表达了自适应策略:"我从询问愚蠢问题开始,如果AI困惑了,我会提供更多细节"。这种灵活的粒度控制可能是区分新手和专家的重要指标。
多模态输入的现实状况
尽管Karpathy强调语音输入,实际观察显示文本仍是主导模式:
这个发现说明理想的vibe coding和现实的vibe coding之间还存在差距。
传统调试技能的持续重要性
研究者发现,调试是最能体现专业知识价值的环节。程序员依然大量使用传统技术:
这些传统技能在AI时代不但没有过时,反而变得更加关键,因为它们是判断AI输出质量的基础。
AI辅助调试的新模式
同时,AI也在调试中发挥独特作用:
但关键是,这种AI辅助建立在程序员准确识别和描述问题的基础上,AI更像是一个执行修复方案的工具,而不是诊断问题的专家。
代码阅读的"印象式扫描"
研究者观察到代码阅读方式的根本性变化:从逐行仔细审查转向快速的"印象式扫描"。
关键扫描要素:
这种能力需要深厚的专业知识支撑,因为只有专家才能通过快速扫描判断代码质量。
超越代码错误的深层挑战
研究者识别出几类独特挑战,这些挑战的复杂性远超传统编程:
这些挑战需要全新的技能组合来应对。
创新性应对策略的涌现
应对策略同样富有创新性,体现了社区的快速学习能力:
这些策略的出现说明vibe coding社区正在快速积累和分享最佳实践。
专业知识使用的时机分析
研究者发现专业知识在vibe coding全程都在发挥作用,但方式发生了变化:
这种"全程参与但角色转换"的模式,要求程序员具备比传统编程更强的综合判断能力。
三维技能矩阵的出现
vibe coding需要的专业知识呈现立体的三维结构:
维度一:传统编程知识
维度二:AI专业知识
维度三:产品管理能力
这种多维技能要求可能重塑编程教育和人才培养模式。
手动工作切换的战略决策
研究者分析了程序员选择手动工作的具体情境:
这些切换点的识别,可能是衡量vibe coding熟练程度的重要指标。
分粒度信任的精细化特征
研究者观察到信任的复杂性远超简单的"信任"或"不信任":
YT21开发者的表述很典型:"我喜欢审查更改,因为这有助于我保持一定程度的控制",这体现了一种成熟的信任态度。
信任发展的典型模式
典型的信任发展轨迹呈现清晰的阶段性特征:
标准轨迹:初始谨慎接受 → 成功经验强化 → 信任水平提升 → 意外失败 → 重新校准
实际案例:YT15中AI成功生成复杂动画时的惊喜反应("如果真的工作会很疯狂"),以及成功后的信任强化("哇,这正是我要求的"),展示了这种动态过程。
这种基于经验的信任建立比理论上的信任度量更可靠。
vibe coding定义的社区协商
研究者发现,vibe coding的定义正在通过实践进行社区协商,呈现多元化特征:
这种定义的多样性和演化性,体现了新兴实践的特征,意义在使用中建构。
流媒体表Y对实践的塑造影响(Y=演)
研究者敏锐地观察到表Y因素对vibe coding实践的双重影响:
表Y化倾向:
真实性保持:
这种表Y与实践的互动关系,可能正在塑造vibe coding文化的发展方向。
看完这以上9个维度的分析,您可能会发现vibe coding实际上就是Context Engineering在编程领域的自然涌现实践,这不仅仅是巧合,而是AI协作模式演化的必然结果。如果说vibe coding揭示了"AI协作编程是什么",那么Context Engineering就提供了"如何系统性地设计和优化这种协作"的完整方法论。您可以看下昨天这篇《第一性原理的Context Engineering工具、指南》
格式塔心理学诞生于20世纪初的德国,又称为完形心理学,核心观点是"整体大于部分之和",人类认知倾向于将零散信息组织成有意义的整体模式。就像您看到下方配图的三个点,大脑会自动把它们"看成"一个三角形,而不是三个独立的点。
这种"整体优先"的认知机制在日常生活中无处不在:我们一眼就能识别朋友的脸,却很难描述具体哪个五官特征让我们认出了他。研究者巧妙地用这个理论解释了"vibe"的本质,程序员通过整体感知来理解AI生成的代码,而不是逐行分析。这种"vibe check"依赖于专业知识形成的心理模式,能够快速判断代码的整体质量和正确性:好的vibe意味着代码符合程序员的心理预期,就像看到熟悉的代码结构会产生"这感觉对"的直觉;坏的vibe则像看到不协调的画面,立即触发"有什么地方不对劲"的警觉,提示需要进一步检查或修正。
对于正在开发AI产品的您来说,这项研究的最大价值在于重新定义了编程能力。传统的"能写多少行代码"已经不是核心指标,而应该关注"能否有效指导AI完成复杂任务"。这要求工程师具备更强的系统思维、质量判断和人机协作能力。
研究显示,成功的vibe coding需要完整的工具生态系统支持。如果您在开发编程辅助工具,应该考虑提供上下文管理、多模态输入、差异可视化、错误信息智能处理等功能。特别是要设计"productive resistance",适度的阻力和反馈,帮助用户保持对AI输出的批判性思维。
研究者还发现了AI使用的"社会评价困境",使用AI工具可能面临"偷懒"、"缺乏技能"的负面判断。由于视频是在公开平台直播,开发者在编程的同时也在进行“表Y” 。他们会有意地展示自己的专业技能(如快速发现AI的错误并修正),以反击“使用AI是偷懒或没技术”的社会偏见,从而将“熟练使用AI编程”塑造为一种高级技能 。
这项研究的价值不只是揭示了一种新的编程方式,更重要的是提供了观察AI如何改变知识工作的窗口。作为AI产品开发者,您需要认识到:技术进步不是简单的替代关系,而是人机协作模式的不断演化。真正成功的AI产品,应该能够放大人类的专业能力,而不是完全取代人类判断。vibe coding告诉我们,即使在看似"AI主导"的工作流程中,人类的专业知识、创造性思维和质量把控依然不可或缺。我的ima知识库“AI修猫Prompt-上下文工程”我会分享在群里,欢迎你来一起交流!
文章来自于微信公众号“AI修猫Prompt”。
【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。
视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/
项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】Whisper是由openai出品的语音转录大模型,它可以应用在会议记录,视频字幕生成,采访内容整理,语音笔记转文字等各种需要将声音转出文字等场景中。
项目地址:https://github.com/openai/whisper
在线使用:https://huggingface.co/spaces/sanchit-gandhi/whisper-jax
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales