前字节技术负责人创业，要做企业级Coding Agent平台，已获数千万元融资

8392点击 2025-12-29 19:15

仅用半年时间，杨萍就目睹了AI Coding赛道有多疯狂。

2024年，Vibe Coding赛道发展如火如荼。Cursor从2023年的100万美元ARR，暴涨至2024年11月的6500万美元，估值更是在短短四个月内翻了超6倍。

彼时，杨萍正在字节将第一款Coding产品MarsCode推向市场不久。作为技术研发负责人，从2021年开始，她就已经在字节带领百人团队，探索将AI应用在软件领域的应用，打造的产品曾服务字节内部数万研发人员，帮助公司节省亿级别的研发预算。

“那时我们就已经发现，AI在Coding领域的应用潜力很大，并且用户更关心的是能否直接看懂和有效使用。”她对《智能涌现》表示。

但当赛道急剧变化时，杨萍内心产生了强烈的紧迫感。

变化体现在两个维度：一是这些C端Coding产品不仅获得了资本的高估值，收入也在猛涨，证明市场对AI编程工具的真实需求；

二是市场格局正在重构——无论国内还是海外，To C方向的Coding产品，已经插满了先行者的旗帜，但越来越多厂商转向To B市场，企业级需求开始爆发。

这些变化让她意识到，创业时机已经不能再等。2025年7月，杨萍与两位联创正式成立新公司“词元无限”，希望提供面向B端企业的AI Coding Agent服务。

近期，词元无限正式完成了数千万元天使轮融资，投资方为某软件产业CVC。本轮融资由航行资本担任长期财务顾问。

词元无限也吸纳了来自毕业于清华姚班、字节等公司的资深人才。CTO王伟为清华姚班校友，曾任国内知名具身机器人公司与大模型创业公司的技术合伙人。商业化负责人李莹拥有十余年AI产业落地经验，曾在大模型To B领域主导完成了数亿元规模的项目落地。市面上的通用AI编程工具，虽然代码生成速度快，能迅速编写许多小型应用，但在面对企业复杂的遗留系统（Legacy Code）、技术栈和严苛的业务规范时，往往显得水土不服。

比如，一个典型的金融场景案例是：银监会规定开户流程必须包含特定的合规步骤，而通用AI工具可能会根据公开数据自行设计出若干个步骤。这种代码生成得再快，在企业眼中也是不可用的废代码。

为了让Vibe Coding真正进入企业级生产场景，硅谷正在复兴一个经典概念——FDE（Forward Deployed Engineer，前沿部署工程师）。

这一模式由Palantir在2010年提出，目前已经在AI行业掀起招聘热潮，包括OpenAI、Anthropic在内的企业，均宣布将包括FDE在内的应用AI团队，扩大数倍规模。

词元无限希望用AI，打造类似这样的Agent服务——让高水平工程师直接进入客户现场，他们既是技术专家，又是商业顾问，帮助企业将前沿AI技术应用到生产环境中。

前字节技术负责人创业，要做企业级Coding Agent平台，已获数千万元融资 | 智能涌现专访

12月初，词元的核心产品InfCode正式上线了第一个版本，形态为插件+企业级的AI Coding平台。InfCode帮助企业完成代码治理、补全、审查、任务规划等等工作，相当于一个中阶研发工程师。

InfCode通过两层机制解决这一问题：第一层是标准化对接——通过内置的MCP Server连接器，快速集成飞书、企业OA等常见办公系统，使AI能够实时查询企业内部文档和规范；

第二层是个性化适配——针对每家企业独特的微服务架构、内部流程和遗留系统，提供开放接口，由企业IT团队进行轻量级适配。

在实际POC验证中，词元合作目前正在合作的客户案例中，研发效率提升了近40%，AI生成代码的可用率达到88%以上，质量达到中级程序员水平。

更重要的是，词元无限并不关注中间过程的AI准确率，而是直接衡量项目交付的价值——比如人效、项目时间的提升等。

目前，在全球权威智能体评测基准SWE-Bench Verified上，InfCode以79.4%的得分刷新了世界最佳纪录（SOTA），超过公开排行榜上GPT-5、Claude等顶尖模型65%左右的成绩。

在2025年的中国，做To B市场依旧是个不容易的决定。在上一个AI 1.0时代，不少AI公司的发展说明，如果只有单点技术能力，很容易落入无穷无尽的定制化、大项目中。

不过，杨萍认为，AI Coding或许能让To B落地走出一条不一样的道路。

这背后，既有基模发展迅速的原因——2025年，基础模型厂商在Agent能力上的建设上，不遗余力，刚上新的Gemini 3 flash，就已经比数月前的Gemini 2.5 pro能力强上数倍，带来的业务价值是立竿见影的；

二是C端AI产品在迅速普及，比如Cursor、Replit等垂类Coding产品，还有ChatGPT等通用的AI助手，都在让企业研发群体对AI的接受度和付费意愿，远超预期。

杨萍表示，最终Agent的商业模式，会走向以结果为导向的方式（RaaS, Result as a Service），让企业管理者能够清晰计算投资回报率。“C 端产品的普及已经完成了对企业研发人员的市场教育，现在的关键是解决最后一公里的业务理解问题。”杨萍说。

在第一轮融资完成之际，词元无限的几位联创也和《智能涌现》聊了聊，To B AI Coding的痛点、机遇都在何处。

以上为访谈原文，经《智能涌现》编辑整理：

企业级场景和Vibe Coding，很大程度是相悖的

《智能涌现》：咱们从创业的起点开始聊吧，一开始你是在字节做Coding产品，再到创业，整个过程背后是怎么考虑的？

杨萍：2018年到2024年，我在字节主要负责智能化和软件工程相关的工作。在大语言模型爆火之前，我们已经在研究一些深度学习和生成学习模型，但那时候主要还是在学术界做一些探索。

从2021年开始，我和整个团队持续观察、做一些强化学习的相关应用，包括深度学习在代码场景的应用等。

字节内部的AI Coding产品始于22年中，我们相当于完整经历了从0到1的过程。后来我选择在24年8月离开，经过一段时间的学习后，在今年7月创建了词元无限。

《智能涌现》：2024年8月，那会Marscode刚推出不久，离开自己一手带起来的产品，会不会有犹豫？

杨萍：最关键的还是大模型的浪潮下，机会多。人应该在巅峰时期做选择，不应该在落寞的时候做选择。要不然，你觉得你有什么理由去说服别人愿意真金白银投给你？

创业者心态应该是在干得好的时候出来高举高打，这时候恰恰是有经验，也是有自信的。

在我们成立公司之前，Cursor、Replit这些明星公司，基本都在2023年的大半年间，市场表现和估值开始猛涨。

这个事情对我还是有挺大触动的，觉得在大厂，竞争跑得也不一定有外面的快，创业时机很重要。

《智能涌现》：以前你们做的AI Coding产品，是直接面向开发者的，但新公司词元无限选择了面向企业端市场，为什么会选择转变方向？

杨萍：To B和To C在开发者工具上的区别，其实没有传统软件产品的区别那么大。我们强调企业级，更多的是指想要面对的问题域——企业级场景需要规模化的Agent能力，解决软件交付全流程的问题。

举个例子，有很多个人Vibe Coding产品，主打的是一句话能生成一两万行的demo项目。但你可能很难相信，Vibe Coding能给你生成一个1000万行级别的、可以增加营收或者承载核心业务的软件。

我们其实更关注的是这种严肃级的企业级编程的场景，去挑战这种更复杂的规模化问题。

《智能涌现》：用一句话概括，词元无限的产品能做什么？

杨萍：我们是一个聚焦于企业级场景的AI Coding Agent平台。

从底层定义上，我们提供的不只是一个工具，也会提供Agent的平台级能力。这些Agent会深入到企业级软件开发的各个环节，比如在企业级的Coding、Debugging（代码排错）等等，把AI能力深度集成到开发者常用的IDE（开发环节）中。

《智能涌现》：企业级的开发场景里，为什么没法用Vibe Coding产品解决需求，用户痛点是什么？

杨萍：企业开发者最头疼的是在需求、开发、测试、运维等多个平台间频繁切换，这中间有巨大的数据和流程壁垒。比如，在金融、医药这些关键行业，每一次代码改动都要对业务负责。

严肃编程场景，相对来说结果是确定的，对服务稳定性是有要求的，需要按照特定的Context（上下文），来指导用户完成整个Coding过程。

所以本质上，这跟Vibe Coding是相悖的。Vibe Coding产品往往更多依靠基础模型的能力，工程层比较薄。它不完全是你个人意愿的承载，就是你得去理解业务的需求，按业务规范写业务代码，在一定的限制下做项目。

《智能涌现》：能举个例子，说明企业客户实际遇到的困难，以及你们怎么是解决的吗？

王伟：企业开发往往是几十甚至上百人协作，因此产品必须能与企业现有的研发流程自然对接。

比如，开发电商系统的前端页面，如果只使用Vibe Coding，写出来的页面可能跟后端系统逻辑对不上；但我们的AI Coding Agent能连接到多个后端项目，参考相应的代码接口和文档，确保前后代码逻辑一致并且能真正跑通。

Vibe Coding产品在B端场景效果有限，正是因为它们基于这类场景来设计的。

以金融的账户风控逻辑为例，银监会有明确的政策指导文件，要求开户流程必须检查若干步。如果简单使用Vibe Coding产品去生成，它可能会很“聪明”地帮你设计出很复杂的检查流程，但最终结果货不对板，完全不满足基本的流程要求。

我们的Coding Agent要解决的就是这种依赖复杂、代码量大且关联多的场景。例如企业系统“存量项目”，动辄十几万甚至上百万行的代码仓库，模型的上下文空间肯定是不够的。

这就需要在Agent层面来优化设计，我们Agent设计了两种机制，内功方面主要是针对受限上下文窗口下的Context优化，包括上下文动态压缩、加载卸载机制，用于解决模型先天局限性，外功方面主要是引入更多的连接，通过mcp等开放协议将企业研发过程中的各类信息（包括文档、外部依赖、数据库等）动态的引入到Agent环境中。这种内外兼修的方式取得了不错的效果。

《智能涌现》：用一个具体的案例，来说明你们的产品是怎么帮助用户解决问题的？

王伟：我们现在有一个典型的合作案例，是跟一家金融上市公司做的。实施分为两步：

第一步是提供标准化产品，重点关注上下文工程（Context Engineering），确保智能体自身的设计能够避免上下文长度不够的问题。

第二步是解决“信息从哪里来”的问题。

这部分信息对接分为两类：一是标准化的，通过内置MCP Server连接器快速集成git仓库、制品管理系统和文档系统等环境，让Agent能精准读取外部信息；

另外一部分是非标的个性化系统，我们开放接口和适配器，客户侧的团队快速集成了他们内部的OA系统。

这两步实施下来，最终实现了又快又好的效果。客户实际测试，与中级开发人员的能力水平基本持平，最终帮客户提升了将近40%的人效。

《智能涌现》：这个40%是怎么算的？怎么定义任务被解决？

王伟：只看最终效果，也就是直接对比人力投入，比如研发周期（人天）。

这些指标一定是跟业务目标直接挂钩的。在整个开发过程中，我们不去拆解中间有多少类型的情况，也不管用 AI 生成后还需要多少人力去修复或者调整。只看这个团队把同样价值的事儿做完，到底节省了多少人力成本。

从企业管理者视角看，最关心的就是这个最终交付的价值，而不是其他的过程指标。

《智能涌现》：那你们的收费模式是怎么样的？

李莹：目前我们正在有在和头部的几家 ISV（独立软件开发商）以及大型终端客户进行协议签署和探索。

针对工具类产品，我们会收取 License（授权）和Agent 订阅费；针对平台类产品，除了收取一些标准费用外，也在考虑分润模式。

从插件到IDE，产品形态不是最核心的问题

《智能涌现》：你们刚刚提到词元无限是解决“严肃编程场景”的问题，这跟Vibe Coding解决的问题，主要区别是什么？

李莹：市面上C端市场大家做的Coding类产品，实际上解决的是轻量化软件的交付能力。而面对一个复杂的企业级业务场景，它其实很难做到更好。

而这恰恰是我们眼中巨大的市场空间，可能看上去是dirty work，这反而成为创业公司的机会。

王伟：资本往往偏好C端Coding产品，因为在大模型时代它像快消品，商业模式简单清晰且容易扩张。但你会发现，越平权的技术，或者越薄的 Agent 产品，往往非常依赖信息差和时间差。

现在的情况是Vibe Coding产品层出不穷，但各领风骚几十天。最终的结果就是Vibe Coding交付物泛滥，最终价值快速衰减甚至接近归零。

我们更想去真正有挑战的地方，要去有复杂度壁垒的地方，比如如何通过Coding Agent来交付一套电商系统。这是我们认为真正价值的场景，也是和C端的根本差异。

《智能涌现》：从产品形态来看，InfCode为什么会选择从插件做起？

杨萍：现在大家习惯使用插件或IDE，但这只是代表这个阶段用户习惯用什么样的产品而已，不是最本质的形态，但我们可以用这种形态去切入市场，减少用户的使用门槛。

我们的IDE还在筹备中，很快就会上线，后续会建立起Coding Agent企业级平台。

Coding工具链其实很长，涵盖了从编辑器、调试、编译到产物管理及上线服务的全过程。我们认为，整个工具链一定会Agent化的。未来我们提供的不再是一个单一工具，其实会更像是一堆Agent的集成平台。

《智能涌现》：词元无限的产品开发过程中，你们大概多少代码会用Agent直接写？

王伟：通用类型代码编写，占比比较高，大约80%左右。Agent核心代码部分大约50%上下。

目前Agent核心部分是使用rust编写的，由于很多功能属于新的设计，目前基模对这类模式没有太多的预训练知识支撑，所以很多时候需要我们自己去摸索和实现。

《智能涌现》：你们刚刚提到企业上下文管理和业务承载能力，这个具体是怎么实现的？因为每家企业的infra都不一样，这个挑战其实挺大的。

杨萍：这里分几类。第一是偏标准的场景，比如说文档管理，不管对接到飞书文档还是企业的OA系统，这其实是有市占率比较高的产品，来提供服务的。

对于这类产品，我们会内置连接器，类似MCP的服务，能够把这些产品快速集成进来。一旦配置完成，我们的Editor在工作时就能直接查到这些信息，服务于整个工作流程，让它工作得更精准。

第二类就是Infra和更底层的服务，这确实是个挑战。因为每家公司的微服务、日志体系、日志等级定义甚至规范都不一样，这些东西永远没办法被文档去穷尽。

我们目前通过提供一整套进程系统，把定义问题和发现问题的能力交给企业自己。我们提供机制，让他们能够把自己的这些非标的Infra接入进来，而不是我们去一家家硬适配。

《智能涌现》：你们现在的产品，可以达到什么级别的研发人员的水平？

杨萍：我们的插件产品，是瞄准初阶程序员或者实习生所能解决的问题的。在代码补全/Debugging这个场景，会进一步面向中阶程序员所能达到的水平。

本质上，我们看的不是只是单纯写代码的那个部分，写代码只占一个研发人员可能30%的时间，研发人员还有其他时间，要收集信息，整理任务规划，我们的产品是会瞄准这个环节的。

过去，研发很难像测试那样量化工作量，但未来我们可以通过Agent来观察。我们很认同红杉提出的 RaaS（Result as a Service）理念，即以结果为服务。

在软件工程领域，这套模式可能会最早实现，因为最终解一定是看你给客户创造了多少实打实的价值。

企业级Coding Agent，还处在卖方市场

《智能涌现》：早期在字节内部做Marscode，其实你经历了从对内提供服务，到对外提供服务的过程。在这个过程中，你有哪些核心的know-how？

杨萍：字节是工程师文化，大家对于技术栈的选择比较自由。所以，沉淀下来的代码资产挖掘起来的难度特别大，所以我们给自己定的ROI，就是不想只做技术，而是要看具体的业务价值。

第二个很重要的发现是，业务方更在意的是你能不能直接讲清楚价值，而不是那些抽象的提效概念。比如说代码删除，我们会直接把算一下能够给服务器资源带来的减少，折算成节省的钱。这对于我们后来看这个赛道非常重要。

《智能涌现》：当时对AI Coding在企业端市场落地，有什么关键判断吗？

王伟：我们认为AI Coding还没有到终局形态。哪怕到现在，这个赛道的高光，也都集中在C端市场。那个时候，我们就觉得B端是空间更大的蓝海市场。

我们过去一年一直在思考：如果这件事情未来一定会有人能做出来，为什么不是我们？所以，这决定了我们哪怕在2025年，也要坚定出来应对这个事，要直接奔着目标去。

《智能涌现》： 现在词元无限切入的场景是否有侧重，比如主要侧重Coding部分，还是做debugging（代码补全、修复等）？

李莹：在实践中我们发现，直接满足企业业务需求的周期往往很长，仅仅交付环节就可能需要3到6个月甚至更久。如果要深入前端去理解业务属性，难度其实更大。

我们会分三个阶段去迭代，第一阶段是工具，以轻量化的模式嵌入到企业内部，辅助其完成代码研发交付。从Coding切入，先去理解企业的代码库和知识库，进而看企业的业务系统，这块可能更好落地，离商业化更近。这也是创业公司擅长做的——跑得够快，迭代够快，能更好地支撑服务。

第二阶段，我们会变成工具+平台，目前我们正处于第一和第二阶段混合的阶段。平台本质上是一个连接器：向下连接新一代AI底层的模型能力，向上搭建Agent。它能帮企业更好地理解自身的业务逻辑与属性，构建底层的代码库。

更重要的是，它还能解决企业遗留了一二十年、压根没有梳理过的业务系统，我们管这叫“旧改”——只有先帮企业梳理好这些旧系统，才能支撑更上层的应用，这其实是更大的市场空间。

《智能涌现》：现在阿里、字节、百度这些大厂都在做Coding Agent，包括Cursor这样的垂类厂商，也在做企业版。你们怎么看待这些竞争？

杨萍：头部企业的布局未必意味着市场的终局。

首先，头部厂商的策略往往高举高打，国内早期Coding产品，比较多聚焦在C端用户运营，例如字节、百度等企业的初期动作。真正具备To B属性的产品，例如Qoder，直至今年下半年才陆续出现。

其次，许多大厂布局Coding Agent的根本动机，很多并不在于工具本身的产品价值。更多是作为云服务与模型业务的入口策略——比如说，会用极低定价甚至“买云送工具”的方式来牵引客户。这种模式虽然可以快速获客，但是难以真正沉下心，来构建扎实的产品能力与生态体系。

现在，端到端的AI编程尚未形成明确的市场标准与行业共识，我们认为这是一个关键的时间窗口，必须要加速确立标准，深度打通企业级的研发流程。

《智能涌现》：所以你们觉得，AI Coding领域的最终态会长什么样？

王伟：如果我们把时间维度拉长一点，AI Coding会逐步从单体工具，进化到人机协作模式，最终会演变为程序员群体本身。这种模式意味着现在的生产力主体和组织就变了。

如何加速这个变化的到来，并实现组织的快速升级转型。这是我们认为这个事情真正的意义。

《智能涌现》：现在投资人最challenge你们的是哪一点？是技术能力、商业化路径还是竞争压力？

杨萍：商业化。

《智能涌现》：上一代AI 1.0时代，很多AI和SaaS公司很多都沦为做大项目、重交付却不赚钱的境地，做AI Coding，怎么避免走这条老路？

杨萍：传统SaaS，更多是用标准化模块来固化解决问题的流程，本质还是单点工具价值。但AI Coding的核心价值是通过N个动态能力，组合在一起解决企业复杂问题。这是在推动业务从流程执行，走向智能决策与生成，商业定价也会和以前不一样。

王伟：我的观点会更乐观一点。快则两三年，慢则三五年，所谓的“定制化”都会变得唾手可得。

AI Coding 与以前的 AI 模式最大的区别在于，它本质上是在创造一种由AI驱动的数字劳动力，规模化扩展、个性化方案与低实施成本的不可能三角，在AI Coding的背景下获得了新的可能性。

在我们的规划里，未来会产生一种新的组织形态——“ISV Agent”（基于Agent作为生产力的独立软件开发商）。

生产模式类似ISV，但核心在于其管理的生产力对象和机制不同——不再是大量的人力，而是由人类直接管理大量的高效Agent员工。Agent能力高低，直接决定新组织形态的生产效率。

《智能涌现》：意思是说现在Agent的供给还偏少，所以企业其实愿意为提供Agent管理服务的厂商付费。

王伟：一是，产品需要能提供足够的价值，如果我们的产品创造的价值不够厚，客户会要求我们做适配，进而失去议价权和竞争优势。

二是，技术会逐步平权，如果三五年后大量对手涌进来，同质化竞争，那客户自然会拿到更多的话语权，这是市场博弈的结果。

所以，创业的时机很重要。现在To B的AI Coding产品还没有形成市场标准和供需平衡，但又有巨大的商业价值，市场是存在红利的。

文章来自于微信公众号 “智能涌现”，作者 “智能涌现”

关键词: AI新闻 , 王伟 , Coding Agent , 词元无限 , MarsCode

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT