仅用半年时间,杨萍就目睹了AI Coding赛道有多疯狂。
2024年,Vibe Coding赛道发展如火如荼。Cursor从2023年的100万美元ARR,暴涨至2024年11月的6500万美元,估值更是在短短四个月内翻了超6倍。
彼时,杨萍正在字节将第一款Coding产品MarsCode推向市场不久。作为技术研发负责人,从2021年开始,她就已经在字节带领百人团队,探索将AI应用在软件领域的应用,打造的产品曾服务字节内部数万研发人员,帮助公司节省亿级别的研发预算。
“那时我们就已经发现,AI在Coding领域的应用潜力很大,并且用户更关心的是能否直接看懂和有效使用。”她对《智能涌现》表示。
但当赛道急剧变化时,杨萍内心产生了强烈的紧迫感。
变化体现在两个维度:一是这些C端Coding产品不仅获得了资本的高估值,收入也在猛涨,证明市场对AI编程工具的真实需求;
二是市场格局正在重构——无论国内还是海外,To C方向的Coding产品,已经插满了先行者的旗帜,但越来越多厂商转向To B市场,企业级需求开始爆发。
这些变化让她意识到,创业时机已经不能再等。2025年7月,杨萍与两位联创正式成立新公司“词元无限”,希望提供面向B端企业的AI Coding Agent服务。
近期,词元无限正式完成了数千万元天使轮融资,投资方为某软件产业CVC。本轮融资由航行资本担任长期财务顾问。
词元无限也吸纳了来自毕业于清华姚班、字节等公司的资深人才。CTO王伟为清华姚班校友,曾任国内知名具身机器人公司与大模型创业公司的技术合伙人。商业化负责人李莹拥有十余年AI产业落地经验,曾在大模型To B领域主导完成了数亿元规模的项目落地。市面上的通用AI编程工具,虽然代码生成速度快,能迅速编写许多小型应用,但在面对企业复杂的遗留系统(Legacy Code)、技术栈和严苛的业务规范时,往往显得水土不服。
比如,一个典型的金融场景案例是:银监会规定开户流程必须包含特定的合规步骤,而通用AI工具可能会根据公开数据自行设计出若干个步骤。这种代码生成得再快,在企业眼中也是不可用的废代码。
为了让Vibe Coding真正进入企业级生产场景,硅谷正在复兴一个经典概念——FDE(Forward Deployed Engineer,前沿部署工程师)。
这一模式由Palantir在2010年提出,目前已经在AI行业掀起招聘热潮,包括OpenAI、Anthropic在内的企业,均宣布将包括FDE在内的应用AI团队,扩大数倍规模。
词元无限希望用AI,打造类似这样的Agent服务——让高水平工程师直接进入客户现场,他们既是技术专家,又是商业顾问,帮助企业将前沿AI技术应用到生产环境中。

12月初,词元的核心产品InfCode正式上线了第一个版本,形态为插件+企业级的AI Coding平台。InfCode帮助企业完成代码治理、补全、审查、任务规划等等工作,相当于一个中阶研发工程师。
InfCode通过两层机制解决这一问题:第一层是标准化对接——通过内置的MCP Server连接器,快速集成飞书、企业OA等常见办公系统,使AI能够实时查询企业内部文档和规范;
第二层是个性化适配——针对每家企业独特的微服务架构、内部流程和遗留系统,提供开放接口,由企业IT团队进行轻量级适配。
在实际POC验证中,词元合作目前正在合作的客户案例中,研发效率提升了近40%,AI生成代码的可用率达到88%以上,质量达到中级程序员水平。
更重要的是,词元无限并不关注中间过程的AI准确率,而是直接衡量项目交付的价值——比如人效、项目时间的提升等。
目前,在全球权威智能体评测基准SWE-Bench Verified上,InfCode以79.4%的得分刷新了世界最佳纪录(SOTA),超过公开排行榜上GPT-5、Claude等顶尖模型65%左右的成绩。
在2025年的中国,做To B市场依旧是个不容易的决定。在上一个AI 1.0时代,不少AI公司的发展说明,如果只有单点技术能力,很容易落入无穷无尽的定制化、大项目中。
不过,杨萍认为,AI Coding或许能让To B落地走出一条不一样的道路。
这背后,既有基模发展迅速的原因——2025年,基础模型厂商在Agent能力上的建设上,不遗余力,刚上新的Gemini 3 flash,就已经比数月前的Gemini 2.5 pro能力强上数倍,带来的业务价值是立竿见影的;
二是C端AI产品在迅速普及,比如Cursor、Replit等垂类Coding产品,还有ChatGPT等通用的AI助手,都在让企业研发群体对AI的接受度和付费意愿,远超预期。
杨萍表示,最终Agent的商业模式,会走向以结果为导向的方式(RaaS, Result as a Service),让企业管理者能够清晰计算投资回报率。“C 端产品的普及已经完成了对企业研发人员的市场教育,现在的关键是解决最后一公里的业务理解问题。”杨萍说。
在第一轮融资完成之际,词元无限的几位联创也和《智能涌现》聊了聊,To B AI Coding的痛点、机遇都在何处。
以上为访谈原文,经《智能涌现》编辑整理:
《智能涌现》:咱们从创业的起点开始聊吧,一开始你是在字节做Coding产品,再到创业,整个过程背后是怎么考虑的?
杨萍:2018年到2024年,我在字节主要负责智能化和软件工程相关的工作。在大语言模型爆火之前,我们已经在研究一些深度学习和生成学习模型,但那时候主要还是在学术界做一些探索。
从2021年开始,我和整个团队持续观察、做一些强化学习的相关应用,包括深度学习在代码场景的应用等。
字节内部的AI Coding产品始于22年中,我们相当于完整经历了从0到1的过程。后来我选择在24年8月离开,经过一段时间的学习后,在今年7月创建了词元无限。
《智能涌现》:2024年8月,那会Marscode刚推出不久,离开自己一手带起来的产品,会不会有犹豫?
杨萍:最关键的还是大模型的浪潮下,机会多。人应该在巅峰时期做选择,不应该在落寞的时候做选择。要不然,你觉得你有什么理由去说服别人愿意真金白银投给你?
创业者心态应该是在干得好的时候出来高举高打,这时候恰恰是有经验,也是有自信的。
在我们成立公司之前,Cursor、Replit这些明星公司,基本都在2023年的大半年间,市场表现和估值开始猛涨。
这个事情对我还是有挺大触动的,觉得在大厂,竞争跑得也不一定有外面的快,创业时机很重要。
《智能涌现》:以前你们做的AI Coding产品,是直接面向开发者的,但新公司词元无限选择了面向企业端市场,为什么会选择转变方向?
杨萍:To B和To C在开发者工具上的区别,其实没有传统软件产品的区别那么大。我们强调企业级,更多的是指想要面对的问题域——企业级场景需要规模化的Agent能力,解决软件交付全流程的问题。
举个例子,有很多个人Vibe Coding产品,主打的是一句话能生成一两万行的demo项目。但你可能很难相信,Vibe Coding能给你生成一个1000万行级别的、可以增加营收或者承载核心业务的软件。
我们其实更关注的是这种严肃级的企业级编程的场景,去挑战这种更复杂的规模化问题。
《智能涌现》:用一句话概括,词元无限的产品能做什么?
杨萍:我们是一个聚焦于企业级场景的AI Coding Agent平台。
从底层定义上,我们提供的不只是一个工具,也会提供Agent的平台级能力。这些Agent会深入到企业级软件开发的各个环节,比如在企业级的Coding、Debugging(代码排错)等等,把AI能力深度集成到开发者常用的IDE(开发环节)中。
《智能涌现》:企业级的开发场景里,为什么没法用Vibe Coding产品解决需求,用户痛点是什么?
杨萍:企业开发者最头疼的是在需求、开发、测试、运维等多个平台间频繁切换,这中间有巨大的数据和流程壁垒。比如,在金融、医药这些关键行业,每一次代码改动都要对业务负责。
严肃编程场景,相对来说结果是确定的,对服务稳定性是有要求的,需要按照特定的Context(上下文),来指导用户完成整个Coding过程。
所以本质上,这跟Vibe Coding是相悖的。Vibe Coding产品往往更多依靠基础模型的能力,工程层比较薄。它不完全是你个人意愿的承载,就是你得去理解业务的需求,按业务规范写业务代码,在一定的限制下做项目。
《智能涌现》:能举个例子,说明企业客户实际遇到的困难,以及你们怎么是解决的吗?
王伟:企业开发往往是几十甚至上百人协作,因此产品必须能与企业现有的研发流程自然对接。
比如,开发电商系统的前端页面,如果只使用Vibe Coding,写出来的页面可能跟后端系统逻辑对不上;但我们的AI Coding Agent能连接到多个后端项目,参考相应的代码接口和文档,确保前后代码逻辑一致并且能真正跑通。
Vibe Coding产品在B端场景效果有限,正是因为它们基于这类场景来设计的。
以金融的账户风控逻辑为例, 银监会有明确的政策指导文件,要求开户流程必须检查若干步。如果简单使用Vibe Coding产品去生成,它可能会很“聪明”地帮你设计出很复杂的检查流程,但最终结果货不对板,完全不满足基本的流程要求。
我们的Coding Agent要解决的就是这种依赖复杂、代码量大且关联多的场景。例如企业系统“存量项目”,动辄十几万甚至上百万行的代码仓库,模型的上下文空间肯定是不够的。
这就需要在Agent层面来优化设计, 我们Agent设计了两种机制,内功方面主要是针对受限上下文窗口下的Context优化,包括上下文动态压缩、加载卸载机制,用于解决模型先天局限性,外功方面主要是引入更多的连接,通过mcp等开放协议将企业研发过程中的各类信息(包括文档、外部依赖、数据库等)动态的引入到Agent环境中。这种内外兼修的方式取得了不错的效果。
《智能涌现》:用一个具体的案例,来说明你们的产品是怎么帮助用户解决问题的?
王伟:我们现在有一个典型的合作案例,是跟一家金融上市公司做的。实施分为两步:
第一步是提供标准化产品,重点关注上下文工程(Context Engineering),确保智能体自身的设计能够避免上下文长度不够的问题。
第二步是解决“信息从哪里来”的问题。
这部分信息对接分为两类:一是标准化的,通过内置MCP Server连接器快速集成git仓库、制品管理系统和文档系统等环境,让Agent能精准读取外部信息;
另外一部分是非标的个性化系统,我们开放接口和适配器,客户侧的团队快速集成了他们内部的OA系统。
这两步实施下来,最终实现了又快又好的效果。客户实际测试,与中级开发人员的能力水平基本持平,最终帮客户提升了将近40%的人效。
《智能涌现》:这个40%是怎么算的?怎么定义任务被解决?
王伟:只看最终效果,也就是直接对比人力投入,比如研发周期(人天)。
这些指标一定是跟业务目标直接挂钩的。在整个开发过程中,我们不去拆解中间有多少类型的情况,也不管用 AI 生成后还需要多少人力去修复或者调整。只看这个团队把同样价值的事儿做完,到底节省了多少人力成本。
从企业管理者视角看,最关心的就是这个最终交付的价值,而不是其他的过程指标。
《智能涌现》:那你们的收费模式是怎么样的?
李莹:目前我们正在有在和头部的几家 ISV(独立软件开发商)以及大型终端客户进行协议签署和探索。
针对工具类产品,我们会收取 License(授权)和Agent 订阅费;针对平台类产品,除了收取一些标准费用外,也在考虑分润模式。
《智能涌现》:你们刚刚提到词元无限是解决“严肃编程场景”的问题,这跟Vibe Coding解决的问题,主要区别是什么?
李莹:市面上C端市场大家做的Coding类产品,实际上解决的是轻量化软件的交付能力。而面对一个复杂的企业级业务场景,它其实很难做到更好。
而这恰恰是我们眼中巨大的市场空间,可能看上去是dirty work,这反而成为创业公司的机会。
王伟:资本往往偏好C端Coding产品,因为在大模型时代它像快消品,商业模式简单清晰且容易扩张。但你会发现,越平权的技术,或者越薄的 Agent 产品,往往非常依赖信息差和时间差。
现在的情况是Vibe Coding产品层出不穷,但各领风骚几十天。最终的结果就是Vibe Coding交付物泛滥,最终价值快速衰减甚至接近归零。
我们更想去真正有挑战的地方,要去有复杂度壁垒的地方,比如如何通过Coding Agent来交付一套电商系统。这是我们认为真正价值的场景,也是和C端的根本差异。
《智能涌现》:从产品形态来看,InfCode为什么会选择从插件做起?
杨萍:现在大家习惯使用插件或IDE,但这只是代表这个阶段用户习惯用什么样的产品而已,不是最本质的形态,但我们可以用这种形态去切入市场,减少用户的使用门槛。
我们的IDE还在筹备中,很快就会上线,后续会建立起Coding Agent企业级平台。
Coding工具链其实很长,涵盖了从编辑器、调试、编译到产物管理及上线服务的全过程。我们认为,整个工具链一定会Agent化的。未来我们提供的不再是一个单一工具,其实会更像是一堆Agent的集成平台。
《智能涌现》:词元无限的产品开发过程中,你们大概多少代码会用Agent直接写?
王伟:通用类型代码编写,占比比较高,大约80%左右。Agent核心代码部分大约50%上下。
目前Agent核心部分是使用rust编写的,由于很多功能属于新的设计,目前基模对这类模式没有太多的预训练知识支撑,所以很多时候需要我们自己去摸索和实现。
《智能涌现》:你们刚刚提到企业上下文管理和业务承载能力,这个具体是怎么实现的?因为每家企业的infra都不一样,这个挑战其实挺大的。
杨萍:这里分几类。第一是偏标准的场景,比如说文档管理,不管对接到飞书文档还是企业的OA系统,这其实是有市占率比较高的产品,来提供服务的。
对于这类产品,我们会内置连接器,类似MCP的服务,能够把这些产品快速集成进来。一旦配置完成,我们的Editor在工作时就能直接查到这些信息,服务于整个工作流程,让它工作得更精准。
第二类就是Infra和更底层的服务,这确实是个挑战。因为每家公司的微服务、日志体系、日志等级定义甚至规范都不一样,这些东西永远没办法被文档去穷尽。
我们目前通过提供一整套进程系统,把定义问题和发现问题的能力交给企业自己。我们提供机制,让他们能够把自己的这些非标的Infra接入进来,而不是我们去一家家硬适配。
《智能涌现》:你们现在的产品,可以达到什么级别的研发人员的水平?
杨萍:我们的插件产品,是瞄准初阶程序员或者实习生所能解决的问题的。在代码补全/Debugging这个场景,会进一步面向中阶程序员所能达到的水平。
本质上,我们看的不是只是单纯写代码的那个部分,写代码只占一个研发人员可能30%的时间,研发人员还有其他时间,要收集信息,整理任务规划,我们的产品是会瞄准这个环节的。
过去,研发很难像测试那样量化工作量,但未来我们可以通过Agent来观察。我们很认同红杉提出的 RaaS(Result as a Service)理念,即以结果为服务。
在软件工程领域,这套模式可能会最早实现,因为最终解一定是看你给客户创造了多少实打实的价值。
《智能涌现》:早期在字节内部做Marscode,其实你经历了从对内提供服务,到对外提供服务的过程。在这个过程中,你有哪些核心的know-how?
杨萍:字节是工程师文化,大家对于技术栈的选择比较自由。所以,沉淀下来的代码资产挖掘起来的难度特别大,所以我们给自己定的ROI,就是不想只做技术,而是要看具体的业务价值。
第二个很重要的发现是,业务方更在意的是你能不能直接讲清楚价值,而不是那些抽象的提效概念。比如说代码删除,我们会直接把算一下能够给服务器资源带来的减少,折算成节省的钱。这对于我们后来看这个赛道非常重要。
《智能涌现》:当时对AI Coding在企业端市场落地,有什么关键判断吗?
王伟:我们认为AI Coding还没有到终局形态。哪怕到现在,这个赛道的高光,也都集中在C端市场。那个时候,我们就觉得B端是空间更大的蓝海市场。
我们过去一年一直在思考:如果这件事情未来一定会有人能做出来,为什么不是我们?所以,这决定了我们哪怕在2025年,也要坚定出来应对这个事,要直接奔着目标去。
《智能涌现》: 现在词元无限切入的场景是否有侧重,比如主要侧重Coding部分,还是做debugging(代码补全、修复等)?
李莹:在实践中我们发现,直接满足企业业务需求的周期往往很长,仅仅交付环节就可能需要3到6个月甚至更久。如果要深入前端去理解业务属性,难度其实更大。
我们会分三个阶段去迭代,第一阶段是工具,以轻量化的模式嵌入到企业内部,辅助其完成代码研发交付。从Coding切入,先去理解企业的代码库和知识库,进而看企业的业务系统,这块可能更好落地,离商业化更近。这也是创业公司擅长做的——跑得够快,迭代够快,能更好地支撑服务。
第二阶段,我们会变成工具+平台,目前我们正处于第一和第二阶段混合的阶段。平台本质上是一个连接器:向下连接新一代AI底层的模型能力,向上搭建Agent。它能帮企业更好地理解自身的业务逻辑与属性,构建底层的代码库。
更重要的是,它还能解决企业遗留了一二十年、压根没有梳理过的业务系统,我们管这叫“旧改”——只有先帮企业梳理好这些旧系统,才能支撑更上层的应用,这其实是更大的市场空间。
《智能涌现》:现在阿里、字节、百度这些大厂都在做Coding Agent,包括Cursor这样的垂类厂商,也在做企业版。你们怎么看待这些竞争?
杨萍:头部企业的布局未必意味着市场的终局。
首先,头部厂商的策略往往高举高打,国内早期Coding产品,比较多聚焦在C端用户运营,例如字节、百度等企业的初期动作。真正具备To B属性的产品,例如Qoder,直至今年下半年才陆续出现。
其次,许多大厂布局Coding Agent的根本动机,很多并不在于工具本身的产品价值。更多是作为云服务与模型业务的入口策略——比如说,会用极低定价甚至“买云送工具”的方式来牵引客户。这种模式虽然可以快速获客,但是难以真正沉下心,来构建扎实的产品能力与生态体系。
现在,端到端的AI编程尚未形成明确的市场标准与行业共识,我们认为这是一个关键的时间窗口,必须要加速确立标准,深度打通企业级的研发流程。
《智能涌现》:所以你们觉得,AI Coding领域的最终态会长什么样?
王伟:如果我们把时间维度拉长一点,AI Coding会逐步从单体工具,进化到人机协作模式,最终会演变为程序员群体本身。这种模式意味着现在的生产力主体和组织就变了。
如何加速这个变化的到来,并实现组织的快速升级转型。这是我们认为这个事情真正的意义。
《智能涌现》:现在投资人最challenge你们的是哪一点?是技术能力、商业化路径还是竞争压力?
杨萍:商业化。
《智能涌现》:上一代AI 1.0时代,很多AI和SaaS公司很多都沦为做大项目、重交付却不赚钱的境地,做AI Coding,怎么避免走这条老路?
杨萍:传统SaaS,更多是用标准化模块来固化解决问题的流程,本质还是单点工具价值。但AI Coding的核心价值是通过N个动态能力,组合在一起解决企业复杂问题。这是在推动业务从流程执行,走向智能决策与生成,商业定价也会和以前不一样。
王伟:我的观点会更乐观一点。快则两三年,慢则三五年,所谓的“定制化”都会变得唾手可得。
AI Coding 与以前的 AI 模式最大的区别在于,它本质上是在创造一种由AI驱动的数字劳动力,规模化扩展、个性化方案与低实施成本的不可能三角,在AI Coding的背景下获得了新的可能性。
在我们的规划里,未来会产生一种新的组织形态——“ISV Agent”(基于Agent作为生产力的独立软件开发商)。
生产模式类似ISV,但核心在于其管理的生产力对象和机制不同——不再是大量的人力,而是由人类直接管理大量的高效Agent员工。Agent能力高低,直接决定新组织形态的生产效率。
《智能涌现》:意思是说现在Agent的供给还偏少,所以企业其实愿意为提供Agent管理服务的厂商付费。
王伟:一是,产品需要能提供足够的价值,如果我们的产品创造的价值不够厚,客户会要求我们做适配,进而失去议价权和竞争优势。
二是,技术会逐步平权,如果三五年后大量对手涌进来,同质化竞争,那客户自然会拿到更多的话语权,这是市场博弈的结果。
所以,创业的时机很重要。现在To B的AI Coding产品还没有形成市场标准和供需平衡,但又有巨大的商业价值,市场是存在红利的。
文章来自于微信公众号 “智能涌现”,作者 “智能涌现”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT