Vibe Coding很火,但「人人都能编程」为时尚早|对话通义灵码神秀

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Vibe Coding很火,但「人人都能编程」为时尚早|对话通义灵码神秀
8115点击    2025-07-15 11:19

Key Points


  • 编程(programming)和写代码(coding)是本质不同的两件事,AI能干好coding,干不好programming;
  • 程序员、创意工作者、普通大众,三类人群需要的AI Coding产品形态各不相同;
  • Vibe Coding面向的是创意工作者,阿里的通义灵码、字节的Trae,都面向程序员;
  • AI Coding未来可能成为超级Agent的底层能力,它在为用户解决问题的过程中开发过一些软件、工具,但用户不需要知道;
  • 结果可能大家(AI Coding和Vibe Coding)都长一样,只不过路径不同,决定胜负的会是资金能力。


AI Coding(AI辅助编程)类公司几乎包揽了今年上半年以来AI应用领域的多个榜首,从新项目数量、融资规模到收入表现,以及人才流动。


刚刚过去的周末,Google被曝花24亿美元招募了AI Coding公司Windsurf的创始团队和顶尖员工。Windsurf原本是OpenAI看中的标的,后者之前已在5月提出用30亿美元收购Windsurf,但因为与微软这位大股东的矛盾,OpenAI错过了与Windsurf的独家谈判期。


在与Windsurf谈收购之前,OpenAI还接触过另一家AI Coding公司Cursor,但后者打定主意要独立发展,上个月,它的ARR(年度经常性收入)就已突破5亿美元,比两个月前的两倍还多,公司估值也已涨至99亿美元。拒绝了OpenAI的收购邀约后,6月,它反向从OpenAI的对手Anthropic那里挖走了同类产品Claude Code的两名核心人员。Claude Code是Anthropic今年2月推出的AI Coding产品。


资本市场对于AI Coding产品的信心一方面来自于这类产品几乎一上线就有程序员愿意付钱的赚钱效应——它对无论收入水平还是工作密度都排名行业前列的程序员来说是种刚需。另一方面,市场信心源自一个浪漫的想象:人人都可编程,人人都是程序员,人人都可能成为开发者。


2023年3月,当OpenAI发布GPT-4模型,Sam Altman掏出手机拍下手绘网页图交给GPT-4而GPT-4把照片变成了真正的网页,「人人都能成为开发者」开始成为一种可以期待的未来。今年2月,OpenAI早期联创、特斯拉自动驾驶原负责人Andrej Karpathy用他的一次「Vibe Coding」(氛围编程)体验宣布这种想象开始成为现实。


「这不是真正的编程——我只是看东西、说东西、运行东西、复制粘贴东西,大多数情况下它都能工作。」Andrej Karpathy在社交平台上写道,他用这种「Vibe Coding」的方式完成了一个卡路里跟踪器应用,它能根据基础代谢率计算卡路里消耗,并用动画显示出来。Andrej Karpathy称,他是在ChatGPT里完成这一切的,ChatGPT编写应用程序用的是Swift语言,他之前从未用过这种编程语言,所以他只是通过与AI多次对话、描述自己想要的功能,AI就生成了相应的Swift代码,当遇到计时器不自动更新时,把问题反馈给AI,AI也能自己解决问题。差不多花了一个小时时间,一个卡路里跟踪器就能在Karpathy的手机上运行了。


目前,市面上已经有不少创业公司在开发类似的「Vibe Coding」——没有一行代码、纯靠自然语言交互的AI辅助编程产品。瑞典的Lovable,以及曾在字节跳动担任剪映产品经理、在月之暗面负责音乐视频生成产品Noisee和Kimi浏览器插件的明超平创业推出的AI Coding产品YouWare,都在提供这种「Vibe Coding」式的编程服务。


Vibe Coding很火,但「人人都能编程」为时尚早|对话通义灵码神秀


阿里云通义灵码技术负责人神秀。


但阿里云通义灵码的技术负责人陈鑫(花名「神秀」)认为,现在谈论「人人都能成为开发者」为时尚早,因为大模型的能力决定了AI只能完成简单应用的开发,比如一个小的产品demo,能展示产品创意、用于可视化交流即可,而今天在App Store上架的几乎所有应用都是复杂的,这种复杂度仅靠AI难以实现。


「哪怕只是iPhone的拍照工具,里面可能就有成千上万个功能点。今天一个大家觉得有用的工具,其实都蛮复杂的,要不然人人都能做出微信来。」神秀说。基于此,他认为AI在编程领域能做也更应该发展的能力方向是「翻译」,而非「解题」,即当程序员完成对一个软件的复杂逻辑描述后,AI能把这一复杂prompt「翻译」成代码,而不是试图去解一个复杂的逻辑题,那样会把编程变成一个撞大运的事。


AI Coding创业据此分化出了两条路径,包括Cursor、Windsurf、Claude Code、通义灵码、字节Trae在内的产品继续服务全球3000万程序员,Lovable和YouWare等产品则追求为完全不懂代码的普通用户提供服务。神秀称,通义灵码不会成为Lovable、YouWare那样的「Vibe Coding」工具和社区,如果要做「Vibe Coding」,会有另一款产品,两类产品在用户群、产品优化方向和团队文化上都会完全不同。


通义灵码可以进化的方向,是在成为3000万程序员的AI编程助手之外,成为包括夸克等上层AI应用、Agent的底层能力。「未来更可能发生的,不是我今天有一个想法、我要开发一个新软件,而是有一个机器人,只要我告诉它我的需求、我要解决的问题,它就会迅速编出一个软件来帮我实现。普通人想要的只是一个结果,你帮我做到就行了,至于你是写软件、写作品还是该怎么做(都不重要),我的目的不是写软件,而是达成一个目标。」神秀说。


编程和写代码其实是两回事


新皮层:AI Coding领域的投资和创业项目在增加。什么原因使AI Coding在这个阶段变得火热?AI的coding能力到达GPT-3.5时刻了吗?


神秀:AI Coding对于大模型能力的要求是顶尖的,今天只有顶尖的大模型才能在AI Coding领域表现优秀。最近大家发布新模型,首先提的就是编码能力有多强,然后再谈其他的。如果大家觉得你的模型编码能力不强,那你的模型大概率是不太行的,行业已经形成了这样的共识。最近业内发布的Claude 4,OpenAI o3-pro、DeepSeek-V3-0324、MiniMax-M1,都是这样的思路。编程是大模型能力的明珠,或者说它的一个外显形式。AI的coding能力有没有到达GPT-3.5时刻很难下定论,但编程能力已经是大模型能力的上限了。


新皮层:阿里2023年10月发布了通义灵码的第一个版本,你们最早什么时候看到了AI Coding方向?


神秀:其实我们看得很早,最早2018年我们就已经在召集团队做代码智能了——那个时候我们叫代码智能——做一些代码缺陷检测。2021年,我们就开始做代码补全了,类似于GitHub Copilot。2023年我们开始大面积投入,因为有了大模型(注:生成式AI)。在此之前,我们做的都是小模型(注:非生成式AI)。


新皮层:AI Coding的范式在2023年发生了什么大变化?


神秀:其实从二十世纪七八十年代开始,学术界就在探索自然语言编程,希望实现自然语言编程,但当时没有足够的技术来实现。后来大家看到GPT强大的生成能力,你给它一个自然语言描述,它就能够生成一段代码,这种生成能力太强了,自然语言编程才逐步有可能变成现实。2018年的时候我们虽然觉得这事有的搞,但那个时候没有足够的技术搞,只有idea,没有技术。


新皮层:足够的技术指什么?


神秀:你想实现自然语言编程,但是你没有大模型技术,那时候的技术实现自然语言编程的效率和准确率都非常低。


新皮层:从GPT3.5到GPT4以及之后更先进版本的大模型,它们的编程能力差异有多大?


神秀:简直是翻天覆地的变化,每次大的模型升级都会带来编程范式的变化,去年Claude 3.5发布之前,大家做的AI Coding产品都是补全人写的代码。Claude 3.5出现以后,才出现自然语言对话式的编程方式。原来是人写代码,AI给我预测一部分,我来决定采不采纳。现在变成了通过对话的方式,我说一句话AI帮我写一段代码,这是翻天覆地的变化。


新皮层:实现这种跨越,背后的原因是什么?


神秀:第一个是(代码预测)准确率变得更高了。第二个是模型开始会使用工具,也就是agent的雏形出现,过去的模型不会使用工具,它只会走一步,但现在它会走多步。第三个就是推理能力。这三个东西使得自然语言编程开始出现。


新皮层:Claude 3.5能完成多复杂的自然语言编程?只描述一个功能,它就能完整实现吗?


神秀:描述一个功能就能实现在GPT时代就能做到,但我们并不认为这是真正的编程。真正的编程绝大部分要在复杂的软件上去做,或者说要能生成一个足够复杂的软件,才是真正的编程。所以它才叫AI Coding,而不是叫AI Programming。


新皮层:coding和programming在你的概念里有本质差异?


神秀:有本质差异。所谓的programming,绝不是说句话把程序写出来而已,这个事不叫编程,编程是要编的,就是你给我个需求,我要考虑它怎么设计、它需要几个类、它们之间的调用关系是什么。coding就是写代码。


新皮层:这种编程范式的变化给通义灵码的产品形态带来了哪些改变?


神秀:已经被潜移默化地改变了。过去我们只做代码补全,现在做一个智能体,再往后的话就是自然语言编程。第一个阶段关注的是敲代码,第二个阶段在于如何跟AI对话,并且校验生成的代码;第三阶段聚焦于如何把一个复杂的逻辑用自然语言表达清楚,并且校验AI生成的结果。


Vibe Coding想让人人都可编程,但这或许是个伪命题新皮层:AI Coding最让你兴奋的地方是什么?


神秀:会有三类主流需求出现。第一是全球3000万名专业程序员,他们会用这个东西(指AI Coding)完全接管复杂逻辑的代码编写,从而提升整个社会的软件制造速度。这能让3000万人发挥出相当于1亿个程序员的能力,生产力翻3倍。这件事是很确定会发生的,我们一直在做、通义灵码在做的就是这个事。


第二是产品经理、设计师、运营等创意工作者,他们可能突然灵光一现想做个软件,拿这个东西(指AI Coding)快速验证一下,或者为了做个demo展示一下、做创意交流,这部分群体有这个诉求。


还有一个就是普罗大众,普罗大众也会使用AI Coding,但他们更可能是面对一个智能体,让智能体帮他写代码完成一件事,他要的不是代码本身,而是用智能体完成一件事,背后的技术可能需要coding。


新皮层:人人都可以编程的时代到来了吗?


神秀:人人都可编程听起来是一件很性感的事,但我并不是特别认同「人人都能成为一个程序员」,编程和写代码其实是两件事,区别在于你能够控制多复杂的文件。


今天的设计工作其实还是要人来做,人如果能够把他的设计意图、结构准确告诉大模型,大模型只需要把人类意图和设计结果翻译成具体的代码,其实这个过程已经能帮助人类发挥非常大价值了。程序员的核心价值不在于把代码写出来,而在于理解产品经理的需求、把需求变成准确的逻辑表达和结构化表达,然后再考虑如何把这些逻辑表达和结构化表达写进已有的代码库里,并且保证它的可靠性、稳定性和扩展性。这些东西就叫架构设计、概要设计、详细设计,是程序员的核心工作。这些东西全部弄好以后,剩下的就是写代码。写代码对程序员来讲并不是最关键的。


如果人人都是程序员,他首先需要有能力描述一个软件的复杂逻辑,这是一个程序员能够开发出复杂软件的核心,今天的绝大部分文科生做不到这一点。今天市面上所有的软件,比如淘宝,我们用了成千上万名工程师才做出来,它里面的功能逻辑特别复杂,一个东西这边动一下,那边可能就出问题了,那边动一下这边可能就不行了。它们之间有非常强的耦合关系,里面有非常多的模块拆解和相互连接,要把整个淘宝的产品逻辑全部梳理清楚、设计干净,并且确保它再增加一个新功能的时候不影响别的模块,这是一个非常专业的事。程序员最主要干的就是这个事。今天市面上已经存在的这些App,不太可能人人都能做出来。


新皮层:我们今天在App Store里看到软件都够复杂?


神秀:基本上都算复杂应用,它们功能都挺多的。


新皮层:一个简单的拍照工具、一个小的即时通讯工具呢?


神秀:这些看似简单的应用其实都特别复杂。就像iPhone的拍照工具,里面可能有成千上万个功能点。今天一个大家觉得有用的工具,其实都蛮复杂的,要不然人人都能做出微信来。所以说千万不要忽视软件的复杂度,我们觉得非常有用的软件,它们的复杂度都非常高。


不过随着AI Coding发展,一些简单的创意型应用可能会变多。这些创意型应用往往是一些简单应用,比如说管理一下相册,或者一些非常有趣的小游戏,或者用来展示自己设计能力、灵光一现的东西。这类东西会变多,但是它们会以什么样的形态存在、在哪里长出来?其实大家还在探索。


新皮层:最后一种是Vibe Coding(氛围编程)类社区在做的事吗?OpenAI联合创始人Andrej Karpathy提出了Vibe Coding的概念,说AI的coding技术已经可以让人用自然语言描述需求,比如告诉AI自己想要创建一个具备特定功能的网站,AI就可以帮用户实现。


神秀:对,现在Vibe Coding在做类似的事。Vibe Coding针对的是零代码经验的用户,这些用户以前不懂软件、不懂架构,但他对于产品有一些具象的想象,提出需求后让大模型去发挥。今天,Vibe Coding可以做的事是制作demo、开发个天气网站或者五子棋游戏,对于这种从0到1的demo阶段,AI是可以自己完成的,因为demo本身的逻辑并不复杂,并且很可能这个需求是大公司以前做过的事,AI看得多了,就能顺利地帮你做出来。但实际上真实世界里的软件都是复杂的,而且一个新软件需要的很多逻辑AI可能从来没有见过,一个软件要想在市面上成功,就得是别人都没做过的东西。


而且,问题是普通人去创造这么多应用有什么用?社交可能是一个需求。但对这种东西有兴趣的,往往是设计师、运营、产品经理,而不是普通用户。设计师、运营和产品经理的用户规模比程序员还少。


新皮层:不会出现小红书、抖音那样用户庞大的基于Vibe Coding的社区吗?自从有了便宜好用的相机,拍视频的人就变多了。


神秀:创造软件和拍视频不一样,你想想你有什么需求要去创造一个软件?至少在现在这个社会中我好像还没有找到这种必要性。你可能自己也不确定,因为往往现在没有的需求,很有可能到技术迭代的时候就爆发了,只是现在还看不到,这也有可能。

但更可能发生的,不是我今天有一个想法、我要开发一个新软件,而是今天有一个机器人,只要我告诉它我的需求、我要解决的问题,它就会迅速编出一个软件帮我实现。普通人想要的就是一个结果,你帮我做到就行了,我不管你是写软件、写作品还是该怎么做,我的目的不是写个软件,而是我想达成一个目标。


新皮层:它可能在解决问题的过程当中写过一个程序或者制造过一个什么工具,但是你不知道。


神秀:对,我觉得普通人要的是一个这样的智能大脑,就像科幻片里的贾维斯,他要的是这个,未必是一个人人能写代码的平台。


新皮层:基于目前的AI技术推出的Vibe Coding产品会有能力上限?


神秀:我们认为是有能力上限的,它们能做的软件复杂度不会很高,做一些简单应用没什么问题,做复杂应用是做不到的,因为软件的复杂度是天然存在、无法消除的,世界就是复杂的,不可能用一两句简单的话去表达一件复杂的事情,就像你们写文章一样,如果今天所有的东西都一两句话就能够表达了,很多职业就都不需要了,但这不可能。复杂性是存在的,对程序来说也一样。


新皮层:Vibe Coding那样的自主编程听起来是要求AI能够自动化地完成所有工作,而AI Coding做的只是一个翻译工作。它们一个是解题一个是翻译,解题更难吗?


神秀:听起来前面那个更难,但其实这两件事同样难。因为如果你给AI一个idea让它放手去做,它做a也行、b也行、c也行,反正它做出一种自己跑通了就行。今天用户给Vibe Coding的idea都相对简单,它可以在你这个要求上任意发挥。但如果你给它一个详细要求,要求它准确地每一步都实现,可能更难。


新皮层:任务描述的准确度也会影响Coding生成的准确率?


神秀:对,就是当你给它一个粗糙的问题,反正它做成了就行了,这种对准确率的要求反而是低的。就像你让我画个小鸡,我可以随便画一个,也可以画一个非常绚丽的,反正都是鸡。但如果你让我画一个达到画家水墨画水平的鸡,这对我来说就会变得困难。所以,越具体、越复杂的要求,对大模型越难。


新皮层:AI Coding领域现在的准确率达到了什么水平?相比模型在完成其他任务时准确率更高还是更低?


神秀:AI编程有一定的准确答案,比如说写出来的代码是否能通过编译、是否能通过测试,这是一些关于准确性的验证标准。有了这两个东西,其实AI不会犯大错,即使准确率有问题,也有人类兜底。


其实没必要做这种比较。比如通用Agent,为什么大家都去做deep research?因为它对模型的泛化能力要求高,但对结果的准确性要求没那么高。AI编程也是如此。另一些行业可能对模型的泛化能力要求不高,但对准确率要求高。所以今天 AI的发展其实是要在适合的场景匹配适合的能力,能力匹配了,它就可以在这个领域发挥作用。


新皮层:所以AI Coding是个什么性质的问题?让AI帮助人做coding的工作,它到底是在做一个翻译工作,把自然语言翻译成代码,还是一个类似于解数学题的工作,需要创造性和逻辑性?


神秀:(它现在有能力做的)更像翻译问题。今天我并不是特别确定AI是不是具备创造性的设计能力,有可能它永远都不会擅长。


新皮层:如果今天举办一个编程大赛,让最优秀的人类程序员和AI程序员比赛,结果可能会是什么?


神秀:现在AI写代码的速度是超过人类了,但是AI去构建一个复杂逻辑程序并且持续迭代的能力是远低于人类的。


新皮层:自然语言编程目前还没有完全变成现实的原因是什么?


神秀:自然语言编程之所以还没有完全变成现实,是因为还有两个问题没解决。


第一是大模型本身执行任务的准确率,尤其是执行复杂任务的准确率能力还没达到,这是大模型本身的瓶颈。假如说今天我已经能准确把我想要的架构、我想要的逻辑全部都讲清楚了,而且AI像人类程序员一样对我过去的编程习惯、需求都完全了解,那么AI看着我的(自然语言)文档应该就能把代码写出来,但是现在AI做得还没有那么好。当我写了一个非常完整的逻辑和设计描述,如果AI可以准确地把代码写出来,这个时候,就达到了我们所谓AI「自主编程」的第一步,也就是自然语言编程。


第二个瓶颈来自应用层,即我们还没有探索出如何通过自然语言沟通就能让AI开发出具有复杂逻辑的代码,这种交互范式还没有真正探索出来。比如人类要如何表达那么复杂、精确的东西?你表达得不精确,它写出来的代码就会千奇百怪、不可控。那么你该如何去表达?这个叫人机交互创新。我们认为模型创新和人机交互创新必须同时都有,才可以进入到所谓的自然语言编程。


新皮层:在模型能力问题上,AI Coding依赖的是模型的推理能力吗?


神秀:推理能力是一方面,今天AI生成了一堆代码,结果发现编译不通过,那模型是不是能通过推理能力准确找到问题再把它修复掉,以及它写的程序走完第一步就报错了,那它第二步要怎么确定问题并修复?这需要推理能力。


另外它也需要指令遵循,我给它了一个很长的描述,它能不能准确执行,且每一步都精确?第二是长上下文能力,我的复杂代码库可能改一个需求需要改10个文件,每个文件都有好几百行代码,加起来成千上万行,AI能不能准确理解每一行的含义,就看这种长上下文的能力。


还有一些,像是多模态能力:假如我给它的描述里面有图片,它能不能理解?以及使用工具的能力,就是你在编程的过程中肯定得调动一些编辑器,调动文件查询、文件编辑、检索等各种各样的工具,所以它还要有工具使用能力。


这个是一个综合能力,所有这些能力都具备了,它才可以准确地去完成coding任务。


灵码面向专业开发者,面向产品经理和小白用户的会是其他产品新皮层:你提到AI Coding有3件事让你兴奋,一个是面向3000万名专业程序员的AI Coding产品,还有两个分别是产品经理和普通用户市场的出现,通义灵码面向哪个人群?


神秀:通义灵码在做第一件事,就是给3000万程序员开发一个生产工具,后面两件事不是我们通义灵码要做的事情。


新皮层:后两件事是现在这个阶段不做,还是以后也不会做?


神秀:以后做了就不叫通义灵码,可能是通义XX或者通义XXX。通义灵码的目标用户非常明确,就是3000万程序员。


新皮层:给3000万程序员用的coding工具和给普通大众的coding工具会不一样吗?


神秀:不一样。给专业程序员提供的产品,有很多代码在里边,大家用的就是IDE(注:集成开发环境,用于编写、调试、编译和部署代码)。我们最近做的IDE业务(注:5月底,阿里云发布旗下首个AI原生的开发环境平台「通义灵码AI IDE」)就是给3000万程序员用的,他们目前的习惯还是看代码。


我们要做的事是先把这部分群体的需求接住,随着AI的能力越来越强,程序员对观测、看见代码的诉求越来越少,直到最后就可以完全不用看代码了。这个时候,人(指程序员)需要在这个工具里看到的东西不再是代码,而是一些软件逻辑。


新皮层:软件逻辑会是怎样的呈现方式?


神秀:有可能是文字,有可能是图,也有可能是各种各样的。现在大家都在创造,这个逻辑具体怎么表达,那是一个未来的创新点。


新皮层:到那个阶段AI Coding产品会不会对普通用户更友好一点?就是说我在一个工具里、一个平台上看到的会是我认识的东西,不再全是代码?


神秀:到时候仍然需要专业的人用。我再强调一点,这个工具(指通义灵码)它不是为非专业人群做的,因为软件的复杂逻辑普通人也看不懂。


新皮层:给普通用户做的AI Coding产品会是什么形态?


神秀:针对上述三类人群的产品形态都会不同。3000万开发者是通义灵码要覆盖的,中间那部分创意工作者可能是Vibe Coding产品覆盖的,剩下的普通用户可能是一些通用Agent来覆盖。面向开发者的产品,我们做的或许会是一个软件开发平台;中间Vibe Coding做的产品可能是一个创意社区;最下面的Agent类产品可能就是一个助手,可能是通义、ChatGPT,或者其他具有coding能力的产品,最终长啥样现在也不知道。


新皮层:MiniMax和豆包已经在助手中加入了AI Coding能力,AI Coding最后会变成所有应用程序背后的基础能力吗?比如以后如果夸克成为超级Agent,它背后的coding能力是否可能是灵码在提供支持?


神秀:对,如果夸克是超级Agent,就是我们说的第三种,满足普罗大众的那种产品,AI Coding只是藏在它背后的能力,它不需要让人知道,但是它能帮你办成事。


新皮层:到时普通用户可能通过夸克的对话窗口说「你帮我设计一个什么小东西」,哪怕只是一个很简单的工具或者软件?


神秀:它要不就帮你生成软件,要不就是直接帮你把你要干的事干了,软件做不做出来无所谓,达成你的目标就ok。


新皮层:通义灵码是AI Coding还是Vibe Coding?


神秀:Vibe Coding是一句话生成的需求,我们把这叫Vibe Coding。但是到那个阶段,Vibe Coding的定义已经跟现在的Vibe Coding不一样了,那时的Vibe Coding等于如何通过自然语言描述一个复杂逻辑把软件做出来。(按照这个定义)你说我们是不是Vibe Coding?我们就是Vibe Coding。因为我们的目标就是让一个人能够通过一个结构化的复杂逻辑表达制造一个软件,其实就是自然语言编程。但是自然语言编程不等于用「一句话」表达需求,AI就能给你一个理想的东西。这种说法夸大了AI的coding能力。


新皮层:你们没想过做第二种产品形态(Vibe Coding)吗?


神秀:目前还没有。


新皮层:如果公司其他团队有Vibe Coding的产品形态,你们依然会是他们的基础能力部分?


神秀:最基础的是大模型,我们是模型的上层,对于更上层的Vibe Coding社区或者Agent,我们会成为它们的coding能力的一部分。基于灵码现有的一些能力可能会长出一个新的产品,但不叫灵码。


新皮层:如果AI Coding成为一个基础能力的话,未来上层的应用生态会发生怎样的变化?会出现一些新的超级入口吗?


神秀:有可能就像夸克这样,我觉得是极有可能的,这种超级入口能做的事情远超现在的搜索引擎。


新皮层:如果一个AI或Agent的coding能力足够强大,未来是否可能会吃掉其他没有这种能力的Agent,成为超级入口?


神秀:AI Coding只是上层应用的底层能力,上层应用做的是场景、是用户满足。其实今天市场对于软件的一个观点是,除了模型,你在上面做应用最重要做的是什么?我们认为是context(上下文),因为模型没有context,它只是一个信息压缩体,你给它什么输入,它就给你什么输出,但它不知道你会输入什么。


所有做AI应用的公司都在维护的东西就是用户的context,如果你是程序员,我的AI Coding产品就要了解你的所有代码库,以及你在上面做了哪些事,我才能预测出来你即将做哪些事,以及根据你的新需求帮你准确完成。所有这些能力都基于我对程序员的理解。如果你对我都不理解,我要让你做一件事的时候,我还得把我脑子里所有的背景知识都告诉你,你才能准确帮我做到,那就不符合我的预期,你就成为不了超级入口。


新皮层:通义灵码和Vibe Coding不可以兼容吗?


神秀:Vibe Coding的用户要的不是coding,不是代码。他们要的是创意,要的是分享,要的是设计,要的是快速实现他的想法。


新皮层:Vibe Coding用户应该也想要复杂产品。


神秀:想要复杂产品,通过Vibe Coding是做不到的。如果能做到的话,现在都已经做出来了,没有做出来,是因为他想要做复杂的产品以现在的技术还实现不了。


新皮层:未来这两类产品有可能会融合吗?


神秀:行业中有一些观点认为会融合,但我认为不会融合,因为这是两类不同人群的不同诉求,会形成不同的产品形态。


新皮层:会不会随着技术的发展,AI变得足够聪明、可以programming了,然后用户就可以自由Vibe Coding了?


神秀:那就跟抽签差不多了,撞大运,你提一个需求,然后它给你做出来什么就是什么。问题是我们在programming里寻求的是确定性,就是今天一个产品经理会说我的产品界面必须长这样、这是我认为的最佳状态,然后你给我做出来,这个叫写程序,不是抽签可以实现的。


新皮层:视频生成应用一开始也被认为不可控,有抽卡率,但它慢慢进化得可编辑、可修改、会根据交互修正。


神秀:后台逻辑怎么描述?还有一个,软件要被保证的东西叫后续的可维护性,包括出问题如何诊断、如何运维,后面有一系列工作。


新皮层:微软已经在他们的开发者大会上提出要让AI Coding去做这样的事情,未来让AI去为他们的客户开发程序,以及做后续运维。


神秀:可以这么做,但是操作这件事的那个人不是产品经理,而是程序员。他仍然要做programming,只是不再写代码,而是在描述一个复杂逻辑。


新皮层:描述一个软件的复杂逻辑,普通人做不到,产品经理也做不到吗?


神秀:做不到,如果能做到的话,产品经理就直接写技术设计文档了,今天几乎没有产品经理能写出来技术设计文档。程序员最大的价值就是把复杂逻辑的技术设计文档写出来,至于他如何把这个东西变成代码,会有好几种方式,一种是他设计完了交给下面一个下属或者实习生写,交给外包写,或者他也可以交给一个AI写。设计是程序员的核心价值,也是软件的核心价值。AI能辅助,但是没有办法完全替代,也不会被产品经理替代。


当然今天有些人的观点是不需要程序员了,产品经理直接就可以写代码,我不是特别认同这个观点。我认为写一些简单程序没问题,但是复杂程序还需要程序员。


新皮层:是现阶段的AI还没有足够的技术所以没有办法做到,还是说未来也做不到?


神秀:目前肯定做不到。未来你说10年20年后能不能做到,我也不好判断。我觉得短期不太会。


新皮层:听说阿里内部已经在把灵码作为一个独立员工使用,它还有一个工号?


神秀:这是我们的一个愿景,我们这么做其实是希望灵码未来能成为每个人的助手,它其实是一个工具。


新皮层:不是希望它可以单独工作、替代一个程序员?


神秀:不是替代,是辅助。分配任务之前,还是需要有人准确地告诉它你要它怎么干。程序员的价值就是告诉AI你应该如何整、怎么干,以及AI干完了以后如何验收,确保它靠谱。程序员这个工种在阿里不可能消失,但是他们的生产力会大幅提升。


新皮层:行业里是不是有的公司激进,有的保守?


神秀:最近火山引擎发布了同类产品Trae,他们的观点跟我们类似,还是以程序员为主体。


新皮层:初创公司可能更激进?比如可能只要有一个idea就可以创业了,不需要程序员。


神秀:对,但是你仔细观察的话,他肯定还有一两个程序员,可能不用那么多,除非真的是非常简单的那种交互系统,或者可能只需要一个前端做可视化,那AI就可以帮你做到了。但前面提到的复杂应用,我觉得近几年甚至5年内AI都不一定能做到。你说让AI写一个淘宝、写一个微信?(不太可能。)


一个创意,AI Coding可以让它快速上线,然后用户反馈也挺好,但是持续再往上叠代码、叠功能的时候,就不能再Vibe Coding了,这个时候他就需要程序员了。


新皮层:AI的coding能力提升后,专业开发者的整体规模会变大还是变小?


神秀:可能会变小,生产力提升了,聪明的、厉害的人才会留下来。


未来的超级入口:去中心化可能是种幻想新皮层:目前在AI Coding领域,国内外厂商的产品有多大性能差距?


神秀:我们认为差距不大,基础模型有一定差距,但这个差距在缩小。通义千问每一代模型跟海外顶级模型的差距都在缩小。


新皮层:OpenAI最近也计划收购一个AI Coding公司(注:该收购近期破裂, Google正在以「雇佣式收购」的方式招募Windsurf CEO Varun Mohan、联合创始人Douglas Chen以及一些顶尖研究人员加入Google),他们可能会做什么事情?


神秀:OpenAI的典型特点就是想往应用层做,我不确定它是不是也判断整个模型的发展会减速或者会遇到瓶颈,从它的实际做法看,它有很大的冲动去往应用层延展,占据主要的AI应用入口。


新皮层:Chatbot不一定是超级入口?


神秀:这只是一种形态。ChatGPT它已经做得很成功了,它想做第二个成功、第三个成功的应用,第二个应用他现在想要编程,它想抢入口。


新皮层:AI Coding应用本身有可能成为一个超级入口?


神秀:它的流量会非常大。另外,它产生的社会价值也非常大,现在全球软件市场有3万亿美元的产值。这个市场如果每年能提升10%的效率,就会是很大的数值,由此带来的连锁效应也会很大。当数字世界的软件产能扩大两三倍的时候,你对整个社会的改变可能是翻天覆地的。


新皮层:软件市场的价值是供给决定的吗?还是说人会需要的软件可能就那些?


神秀:现在不好预判,因为人的需求是不是已经被完全满足,这个事情不好说。当软件供给变得特别廉价的时候,说不定每个人都想开发一个自己的想法,把自己的想法变成产品。


新皮层:你们看AI Coding的视角主要是软件开发的市场规模?


神秀:我们看的是AI对于整个软件产业的生产力提升,以及带来的连锁效应。其中阿里云会受益,因为阿里云本来就是对外提供算力资源、提供基础设施能力,将来会有更多软件跑在云上面。


我不是说让完全不掌握软件设计能力的人去开发软件,前面已经说了编程和写代码不同,但不排除一个人可以学一下,尤其AI让软件开发的门槛降低了之后。过去开发软件的门槛很高,还得学习Java或什么软件语法,现在这些事都AI化了,你只需要学会怎么结构化地去描述。


新皮层:你们不应该赶快把这一类人也变成目标用户吗,而不只是面对那些已有的程序员?


神秀:当这部分人学会了(结构化地描述产品逻辑),他就能用我们的软件,没学会的时候他也没法用。


新皮层:你们的产品现在门槛还是有点高。


神秀:现在软件编程的范式还没有达到真正的变革,当AI发展到一定程度,软件的开发范式发生变革了,我们自然就会去教产品经理如何编程、如何设计软件,他们就会成为我们这个软件的用户。技术还没到那一步,我们现在就没法做这个事。我们等待的就是这种变革。


新皮层:谁去教育他们?


神秀:当变革出现的时候我们就会去教育市场,不止我们,所有人都会教育。


新皮层:GPT-4的发布会上,Sam Altman曾经拿出手机拍了一下他手绘的一个网页图,要求「把这个变成一个网页」,然后GPT-4就生成了一个网页,起码demo里是这样演示的,当时这让很多人惊艳,这种能力今天AI实现了吗?


神秀:可以实现,这种东西非常简单,问题是开发这个软件有什么用,它是一个模型能力的展现,但它并不是一个能够用于生产力的东西。它只是一个很简单的前端展示。


更能让开发者兴奋的不是拍一个东西变成广告,而是AI能「啪」一下补全一个代码,并且这个代码就是我想要的,这会很惊艳。还有一个是我说哪里的代码出现报错信息,它通过几分钟的思考和迭代把bug给解了,开发者会觉得很惊艳,这些东西才是开发者想要的。


新皮层:普通用户想要的东西跟开发者想要的是矛盾的吗?


神秀:普通用户要这干吗?


新皮层:普通用户可能想要设计一个网站,放上个人履历或者作品。


神秀:那只是一个前端展示,就跟照片一样,但如果你想要这个网站有交互,就会不可能。而且你做了这个网站如果是要社交的话,为什么不把简历直接放到LinkedIn上?那里有天然的流量。


新皮层:用户也可能不一定需要流量,每个人都有一个个人网站,这不是互联网最开始出现时的用户理想吗?一个去中心化的互联网。


神秀:但这个故事已经破灭了,因为只要你的作品想要被人看见,它就需要一个中心化的平台。除非你说我就想弄个独立站,不在意流量——可是你能看到的独立站,都是影响力已经非常大的。独立站诉求刚出现时大家觉得很性感,但这个东西在互联网爆发后迅速就没有了。微博、抖音、小红书、微信小程序出现了。


新皮层:不是因为当时的技术成本太高,建立个人网站难度大?


神秀:不是技术和技术的问题,而是被时代抛弃了。早期那么多blog(博客)网站,腾讯、搜狐都在做这件事,结果微博一来,大家发现流量来得更快,blog直接就被替代掉了。


新皮层:随着AI Coding技术发展、软件开发成本降低,互联网也不会从中心化变成去中心化吗?


神秀:等未来的传播介质完全不一样的时候才可能会,但是现在还没看到这种可能性。目前还没有一种去中心化形态的产品能带来个人流量,并且是精准的个人流量,还没有。我们不是互联网专家,我们是AI Coding专家,所以我们也不完全知道(未来的互联网形态)。


商业模式:AI Coding比Vibe Coding更明确新皮层:哪些类型的公司在进入你们看重的软件开发工具市场?


神秀:AI Coding的生意现在已经是AI里增长最快的领域。以前,软件开发领域全世界最好的公司一年也就几亿美元的收入,而且都是做了很多年的。现在,成立才一年的AI Coding公司就能赚5亿美元了(注:截至2025年6月,Cursor的ARR已突破5亿美元),三五年后,它可能会有几十甚至上百亿美元的收入。市场上限很高,这是我们看到的机会。


新皮层:以前这个市场存在吗?


神秀:存在,但比较小。做灵码之前,我们就是在阿里云做开发者工具,但以前可能开发10年才能做到几亿美元,现在有的公司一年就做到这一点了。


新皮层:这类工具的商业模式是什么?资本市场热衷这个领域是否跟它的商业模式已经相对清晰有关?


神秀:用户付费。这个领域命中了三个东西,高频、刚需、价格低,三个要素全部命中。高频开发程序员天天都有开发需求,然后这类产品的价格又低,每月20美元、40美元,对程序员是很容易接受的成本。所以这个市场成长得很快。


新皮层:它会变成一个价格战的新战场吗?


神秀:会,但是现在10美元、20美元还是50美元,对海外用户来讲差别不是特别大,他们最看重的还是选最好的产品,而不是选便宜的。最好的产品能够获得最大的用户规模。


新皮层:如果不是第一名可能就会很难做?


神秀:对。第三名以后可能就全死掉了,只有第一名能赚钱,这个市场就是这样的寡头市场,所以还是很残酷的竞争。


新皮层:这类产品几乎每个大厂都有吧?


神秀:对,其实就跟原来所有人都训练大模型一样,如果你不是头部的模型公司,人家也不会再因你价格低来找你。另外,持续的服务和迭代能力很重要。通义的核心优势就是阿里巴巴会持续投入大模型,并保持领先。对于基于这种状态构建的AI Coding产品,用户会比较放心。这是一个企业级的诉求,个人用户可能今天用你明天用它都无所谓,企业需求需要持续性。


新皮层:你个人工作中现在会经常用通义灵码吗?


神秀:我自己经常用,也会用其他coding产品。市面上几乎所有的AI Coding产品我都用过——我得了解它们每天更新了什么、他们的特点是什么、我们的特点是什么、我们有哪些优势。


新皮层:你感觉到产品差异了吗?


神秀:不同产品的产品形态可能有比较大的差异,但是在同一产品形态上,大家的差异并不大,现在大家更多是在比拼谁在这个领域跑得更快、体验做得更好、效果做得更好,效果和技术上可能有一些差异,产品形态上没有。所以开发者经常这段时间用这个产品觉得挺好,过段时间另外一个产品好了他就切过去了。


新皮层:跟Chatbot有点像。


神秀:对,个人用户目前还没有形成非常强的黏性,更多是哪个好大家用哪个。我们要保持持续领先的竞争力,否则很快用户可能就会用别人的。


新皮层:灵码不做Vibe Coding,但灵码产品内有没有可能出现一个专业用户社区?


神秀:现阶段,开发者的社区就是GitHub。这么多年了,开发者社区只有两个,CSDN上交流知识,Github里交流代码,这两个社区的形态已经非常成熟了。


在一个软件开发工具上做社区可能不是我们的方向,用户没有这样的心智。但是社区对做Vibe Coding的公司很重要,因为这是它们的竞争壁垒。它们的竞争壁垒不是coding工具,而在于社区。社区做强之后,有钱了,它们也可能往下做(指自研代码模型),把我们这帮做coding的能力都做了,最后它一统江湖,也有可能。只是它们要把我们做过的事全部做一遍。


新皮层:现在市场上有没有既做coding能力又做社区的「两条腿走路」的公司?


神秀:这两个产品,一个面向社交,一个面向复杂和深度,目标不一样。


新皮层:两类产品需要优化的能力也不同?


神秀:完全不同。做社区是要创意更多,并且它要考虑软件如何快速加载、快速分享。而我们考虑的是如何给越来越复杂的工程、越来越复杂的任务提效,如何更大程度地替代程序员写代码的比例,我们考虑的是往精深去做,从技术到产品研发。它们追求的是广度、覆盖更大的人群。这些目标是矛盾的,有时候是统一的,但更多时候是矛盾的。


可能团队氛围都不一样,我们讲究慢工出细活——只有现在我们叫快工出细活,但总体上肯定还是比它们(Vibe Coding类公司)要慢,它们的公司氛围也更追求创意。


新皮层:Vibe Coding公司在教育市场方面可能会起到更多作用?


神秀:不好判断,很可能就像你说的,结果大家都长一样,只不过是从不同方向前往同一个目标。但是这个领域要做起来必须要有雄厚的资金,这些Vibe Coding公司的ARR很难过亿,但是我们这种做专业开发者工具的头部公司已经做到了5亿美元了。


新皮层:做社区的Vibe Coding公司现在还没有明确的商业模式吗?


神秀:目前来看,它们的融资和投入远低于做专业开发者产品的公司。为专业开发者做产品的公司,一定能做出最好的模型、具备最好的能力。


新皮层:但它们可能获得更多用户。


神秀:它们这样做有利于获得用户和黏性,形成用户心智,这是一个独特的竞争优势。但用户很难说他在一个地方AI Coding,然后开发完了把东西搬到Vibe Coding社区里去社交,用户行为不太可能是这样的。所以,除非它们两件事(指社区和模型)都做。


新皮层:你们和Vibe Coding公司会是什么关系?未来是否可能合作而不是竞争?


神秀:很有可能,不管做coding能力还是做社区,后面都会形成一个产品心智。


文章来自公众号“新皮层NewNewThing”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0