YC 如何进行 AI-Native 组织改造:Agent 能力要向所有人开放

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
YC 如何进行 AI-Native 组织改造:Agent 能力要向所有人开放
8475点击    2026-06-03 09:01

YC 一直走在 AI-Native 组织改造的前沿。


过去一年多,YC 的合伙人、Optimizely 创始人 Pete Koomen 在内部主导搭建了一套覆盖全员的 Agent 系统。


在一年时间里,演化成了 350+ 工具的内部注册表、一个全员可见的 Agent 对话系统,甚至每晚还会自动阅读当天所有对话、改进自身技能。在某些具体能力上,已经超过了任何一位合伙人单独的水平。


Pete 在最近的一期播客中,详细拆解了这套系统的构建经验、关键设计决策。除此之外,他也聊了很多关于如何构建好一个 AI Native 组织的心得。


在搭这套系统的过程中,Pete 形成了一个更大的判断:


真正的 AI-Native 组织和「把 AI 当 Copilot 用」的组织有本质差异。Copilot 是 2023–2024 年的做法,AI 辅助你完成具体任务,流程、决策、知识沉淀仍然在人的头脑里。真正的 AI-Native 做法是把 AI 作为整个组织运转的建设层,并且系统性地记录所有 artifacts,包括会议录音、Agent 对话记录、决策文档,让这些成为 Agent 可以学习、检索、利用的原材料。


同时,它还需要两个前提:Trust by default(默认信任) 和 Egalitarian(平等主义)。AI 能力必须向每个人开放,所有 Agent 对话默认对全员可见。这与大多数 command and control 式的企业是相反的,但只有这样,Agent 才能拿到足够广的上下文。


01 


从给财务搭建 Agent 开始,


一开始就放开权限 


Gary:YC 这两三年一直在投资 AI 公司,但很多人不知道,YC 内部也在用同样的东西来改造自己的组织。Pete 一直在主导这件事。从头说起吧,是什么契机让你开始做这个?


Pete:大概一年多前,我和几个工程师在跟财务团队合作,讨论要给他们建什么工具,记账分录(journal entries)、记录融资轮次(priced rounds),这些让 YC 运转的日常流程。


我同时看到两件事在发生。一方面,我们有个传统循环:财务团队向工程师描述复杂的工作流,工程师把它翻译成确定性软件,交回去,如此反复。这感觉极其低效。另一方面,这正好是 agentic coding 工具起来的时候,Windsurf、Cursor 已经很成熟,Claude Code 也差不多那时候推出。我在自己的机器上用这些工具,感觉像开了挂。然后回头看公司内部还在用老方法,这个鸿沟越来越大。


所以原始的想法就是:为什么不直接给财务团队构建能运行 Agent 的工具?让他们用英语提示词来表达工作流,而不是让工程师去写 Ruby 代码。


这个想法成为了整个 YC AI 基础设施建设的原始动力。Pete 与工程师 Jared 等人开始着手构建 YC 自己的 Agent harness,最初仅仅是一个针对财务场景的专用系统,但很快演变为一个通用的 Agent 基础设施层。


Gary:但最早其实不是编程 Agent,是 LLM 写 SQL 查询。我记得第一个版本就是这个,效果好到我很惊讶,非技术的人居然能直接提问。


Pete:对。我们搭了一个简单的 Agent 循环加工具注册表,第一个真正的 unlock 是 Jared 建的工具,给 Agent 执行只读 SQL 查询的能力。其实是两个工具:一个是查数据库,另一个是读模型文件(model files)。


Gary:Jared 说他觉得自己在「违规」。


Pete:确实。一开始我们的策略是给 Agent 非常有限的、范围严格的工具集。Jared 一直觉得不够强大,做不了他想做的事。然后有一天晚上他偷偷推了一个 PR:直接给 Agent 开放了整个生产数据库的完整只读权限。


Gary:然后它就起效了。


Pete:效果惊人。这其实预示了后来 OpenClaw 的经验,真正阻碍这些工具发挥威力的,不是技术能力,而是我们对安全和隐私的过度担忧。当你把担忧放下一点,你会发现这些东西强大得不可思议。


这就是那种工作与生活之间诡异的割裂,在家里用 Claude Code 或 OpenClaw 什么都能做,到了公司就被塞进一个狭窄的框里。我们一直在试图缩小这个差距。


02 


成本下降带来的不是需求减少,


而是需求爆发


Gary:为什么一个 SQL 查询工具能产生这么大的效果?听起来很简单。


Pete:因为 YC 有一个特殊优势,所有自研软件都跑在同一个 Postgres 数据库上。公司表、创始人表、财务交易表、内部 CRM 笔记,全在一个地方。别的公司把这些功能外包给各种第三方 SaaS,我们全是自己建的。


我现在可以问 Agent:「给我看过去四个 batch 里投了太空相关公司的所有投资人。」当所有上下文在一个地方,再加上一点 schema 说明,Agent 就能回答关于我们业务的任何问题。


Gary:最酷的不是让回答问题变容易了,是我们开始问以前根本不会问的问题。以前用 BI 工具,问一个这样的问题要好几小时写 SQL,所以除非特别重要你根本不会去问。如果需要去敲数据科学团队的门、排他们的工作队列,你问的问题就会少得多。


Pete:完全正确。这是杰文斯悖论的又一个实例,当你把团队间的来回沟通成本降为零,提问的数量和复杂度都会爆炸。杰文斯悖论说的是:当某种资源的使用效率提高时,人们反而会消耗更多这种资源。对 YC 来说,SQL 查询的门槛降低之后,不仅已有问题变得更容易回答,更重要的是人们开始提出以前根本不敢提的问题。成本下降带来的不是需求减少,而是需求爆发。


现在外面看这个的人,大部分还活在那个老世界里。2026 年了还是这样,有点不可思议。但也意味着前面还有很长的路可以走,这让人兴奋。


Gary:如果你的公司不像 YC 这样有统一数据库,怎么办?


Pete:我觉得正在发生的事情跟当年 Google 做 BigTable 类似,从 schema + join 变成一张针对检索优化的大宽表。你需要把数据反规范化(denormalize),放到一个针对 Agent 理解和检索优化的格式里。


Gary:这正是我用 Gbrain(Gary 自己开发的一套 agent)做的事。我把来自多个系统的数据整合进去,内置了 RAG、Graph RAG、RRF 混合重排序……所有关于检索的经验现在都在为 Agent 服务。当你给 Agent 一个灵魂,给它数据,让它知道你是谁、你关心什么,它就获得了疯狂的翅膀。它能看到你看不到的角落,你问一个问题它甚至会重新解读你的意图,给你一个坦率说需要一个非常了解你的人才能给出的答案。


你可以用 MCP 包一层,但老实说我直觉上觉得,这些模型用 MCP 和 CLI 都很强,但用 CLI 似乎更强一点。总之核心是:你得做反规范化,把它放到一个专门为 Agent 优化的格式里。


03 


上下文放在一个地方,


要有工具注册表 


Gary:YC 的 Agent 系统的架构是什么样的?


Pete:核心架构极其简单:一个 Agent 循环(agent loop)、一个工具注册表(tool registry)、一个模型路由器(model router)。其中,工具注册表是最核心的组件,它会把 YC 各团队构建的业务工具集中管理,将 Agent 的通用能力与 YC 的具体业务逻辑连接起来。


Gary:聊聊工具注册表。如果你在任何其他组织,会最优先建什么?


Pete:两件事:第一是把所有重要上下文放到一个地方,第二就是内部工具注册表(tool registry)。


工具注册表是让 Agent 在工作中真正有用的东西。一开始我们只有大约 20 个工具。但每次遇到一个可以用 Agent 改善的工作场景,就加一个工具。现在已经超过 350 个了,我刚查过。每个团队都在加自己的工具。


我可以管理我的 office hours,财务团队可以记账入账,活动团队可以管理 events,所有 YC 重要的工作都有对应工具。这些工具不仅在我们内部 Agent 系统里可用,也可以在每个人自己机器上跑的 Claude Code 里用。


工具注册表本质上是一个 Resolver(解析器),它告诉 Agent「我能做什么」。Agent 接到任务后,先查 Resolver 决定调用哪个工具,再去执行。


Gary:在工具之上还有一层 Skills。这部分我来说说我的经验,因为在 OpenClaw 里走了同样的路。


如果说工具(tools)是具体的操作接口,那么技能(skills)是对工具的更高层封装,一种可复用的、有明确语义的能力单元。我有一个叫 Skillify 的元技能(meta skill),做完某件新事、觉得结果不错,就说「skillify it」,Agent 就会把操作封装成可复用技能,注册到 Resolver 里,以后像调方法一样随时调用。Hermes Agent 也有类似的东西,他们叫别的名字,但本质一样。


但最重要的不是 Skillify 本身,是之后一步:我有个叫 check resolvable 的元技能,每次 Skillify 之后都会调用,让 Agent 检查所有现有技能,评估新技能是否与已有技能重复,并建议如何整合。它检查两件事,DRY(Don't Repeat Yourself):有 10 个做同一件事的技能是坏的,有一个带参数的技能是好的。MECE(Mutually Exclusive,Collectively Exhaustive):说出来有点丢人,这是麦肯锡做 slide deck 的术语,但模型天然理解这些概念。如果你有一个 DRY + MECE 的 Resolver 表,那就是最优解。


Pete:这些概念在各种 Agent harness 里被反复独立发现,Claude Code 有 skill registry,我们有 tool registry,OpenClaw 有 resolver。感觉就像 Unix 早期发现栈和堆一样,我们正在定义 Agentic 系统的基础原语。你在各种不同的地方,可能是 Claude Code、可能是我们自己的 harness、可能是 OpenClaw、可能是 Hermes,这些东西就是一遍又一遍地出现。


04 


Dream Cycle,


Agent 每晚都在自我进化 


Gary:你们也在做自动化的技能自我改进循环了?这是 OpenClaw 的 Dream Cycle,也是 Karpathy 的 auto-research,Codex 现在也加了 SLG(Self-Learning Goal)。到处在独立出现。


Pete:对。我们有一个通用 Agent,每天晚上会自动读取所有员工当天的 Agent 对话,寻找它本可以做得更好的地方,寻找如果提前知道就能更高效的上下文信息。运作逻辑是:白天员工使用 Agent 完成工作、产生大量对话记录;夜间 Dream Cycle Agent 读取这些记录、识别技能不足之处;次日相关技能的提示词被自动优化,系统整体能力提升。


我来举一个具体例子。我们有一个共享技能叫「两句话描述」(Two-Sentence Description),帮创始人把公司用两句话说清楚。


Gary:得解释一下这是什么,两句话描述是用简洁的自然语言说清楚公司做什么、为什么值得关注?听起来容易但出人意料地难。连最有经验的创始人都会忘记,因为他们有完美的上下文。而且奇怪的是,几乎没有人主动去做这件事。


其实 YC 本身就是一个 context engineering 的过程,我们一直在教人:你脑子里有完美的上下文,但好的沟通是在别人脑中复制同样的上下文。第一句,我能不能知道这到底是什么东西?如果我都不知道它是什么,连问题都问不出来,那我大概就在想什么时候吃午饭了。第二句,它为什么值得我注意?如果同一个房间里有五家公司做类似的事,而你没让我理解你为什么不同。


Pete:两句话描述是一种简单的原子能力,每个 YC 合伙人都反复练习过无数次的东西。Tom(YC 一位合伙人)最初手写了一个提示词教 Agent 怎么做。后来发生了件很酷的事,其他几位合伙人在一次 group office hours 上让 Spring Batch 的创始人当场练习两句话描述,给即时反馈。合伙人脑子里关于「怎么做好这件事」的隐性知识,在那次会议的来回交流中被显性化了,现在活在了那段会议转录的上下文里。


我们把会议转录交给 Agent,说:根据你从这里学到的,改进两句话描述技能。改进后效果肉眼可见地更好。这个技能现在比我们任何一个人单独做都要好。


Gary:这就是超级智能在组织内部诞生的方式。听起来是个小事,但你把任何组织的运营拆开看,就是无数个这样的「原子操作」。


Jack Dorsey 在 Block 做的事情其实也是同一个逻辑,他试图把 Block 变成一个围绕「帮全世界的人互相支付」的小型 AGI。而我们刚才走过的就是这个微观机制:有人写了一个提示词,更多人使用它,使用过程产生了大量 artifacts,这些 artifacts 被用来 metaprompt、在每日 Dream Cycle 中自动改进这个技能,最终这个技能超越了任何单个人的能力。你把组织里做的每一件事都这样处理,你就有了一个超级组织。不是理论,现在每个人都可以做到。


05 


所有 Agent 对话对 YC 全职员工可见


Pete:真正的 AI-Native 组织与「把 AI 当 copilot 用」的组织之间存在本质差异。Copilot 是 2023-2024 年的做法:AI 辅助你完成某项具体任务,但流程、决策、知识沉淀仍然在人的头脑中。真正的 AI-Native 做法是把 AI 作为整个组织运转的建设层(building layer),并且系统性地记录所有 artifacts,包括会议录音、Agent 对话记录、决策文档,让这些成为 Agent 可以学习、检索、利用的原材料。


Gary:有一个微妙但重要的设计决策是,默认情况下,所有 Agent 对话对 YC 全职员工可见。


Pete:对。每个 Agent 对话自动广播到一个内部 Slack 频道,任何人能加入查看。说实话这个决定不是轻松做出来的。我们讨论了很多,「那所有人都能看到所有东西,这样可以吗?」


Gary:最终我很高兴我们选择了开放。


Pete:这个透明度同时解决了好几个问题。第一,知识传播,任何人都能观察别人的用法来学习。我记得你开始大量使用时,你的用法非常有创意,很多人看了之后说「哇,我没想到还能这么用」。


第二,它让你可以在内部安全上更宽松。这些 Agent 在拥有广泛上下文访问权限时最强大,但这跟大多数组织的做法相反。通过默认公开广播,你建立了一种社会性控制。人们知道自己的操作是可见的,在高信任环境里这足以保护私密信息,不需要严格的技术访问控制。


第三,降低新员工门槛。以前新人可能需要六个月上手。现在他们可以通过阅读他人的对话记录快速了解 YC 的工作方式,不是靠占用资深合伙人的时间,而是通过 AI 自动完成的「学徒制」。你刚来不好意思问的蠢问题,问 Agent 毫无心理压力。我自己用编程 Agent 的第一个感受就是:那些我不好意思问人的蠢问题,问 Agent 完全没有心理负担。在组织层面同样如此,更多问题被问出来,人们上手速度快得多。


Gary:这就是 shared organizational brain,是我们能做到的最接近「连接彼此大脑」的东西。如果你把它定位为「让组织中每个人都能借助同事的集体技能和直觉来提升自己」,它的价值就变得极为清晰。


我记得 Anthropic CEO Dario 的那篇文章提到,AI 进步的很多阻碍不是技术性的,而是社会文化性的。两年前录会议还让人觉得奇怪、侵入性的,现在基本默认所有会议都在录了。这不是技术问题,是社会文化的变迁。当所有的会议、对话、工作过程都被记录下来,这些记录就成了 Agent 可以学习的原材料。


Gary:这揭示了超级智能组织必须具备的两个文化特质。我本来不会猜到它们是必要条件,但现在确信了。


第一,Egalitarian(平等主义),AI 能力必须向组织中每个人开放,不只是领导层。如果只有高层才能访问这些工具,组织就无法实现真正的智能化。


第二,Trust by default(默认信任),你必须愿意向员工开放上下文和数据,而不是将信息锁定在权限层级中。


这两者都不是大多数组织的默认状态。大多数企业是 command and control,信息按需分配,这与 AI Agent 需要广泛上下文才能发挥最大价值的特性根本矛盾。


Pete:这种环境在创业公司里最容易实现,小团队、目标一致、高度信任。另外你得愿意花钱,$10,000 到 $100,000 一年在 token 上。


Gary:但如果你投入了、建好技能体系、以开放方式跟团队协作,你基本上在活在 2028 年。现在花 $100K 做的事,两年后只要 $10K,再一年后只要几百块。届时所有人都这样做,我们会说「这就是公司现在的样子」。所以现在有一个一次性的时间跳跃窗口,你可以跳过所有现存的巨头、所有 Fortune 500、所有已有的创业公司。


我在想 90 年代公司开始给员工买电脑时是不是有类似感觉,那些电脑很贵、不稳定,但先买的公司获得了对手无法比拟的优势。


Pete:更准确说法是它抬高了底线。每个人都变强了,特别是新人,他们通过这套系统自动获得了以前需要半年才能积累的上下文。不是替代人,是让每个人都更强。这也是为什么你应该现在创业,因为大量老组织里的掌权者掌握资源和资本,但不相信这些。他们把上下文锁死,觉得不安全。


06 


未来应该是 Agent 包裹着确定性工具


Gary:你之前写了那篇很火的文章 Horseless Carriages。核心观点是什么?


Pete:那是对大量 AI 软件设计方式的批评。说实话,我觉得现在大部分还是那样,没变。


我看到的模式是:公司在原有软件的某个角落嵌入一小块 AI,但整体仍然是大量确定性代码包着。我用的例子是 Gmail 的 AI 写邮件功能。核心问题是:AI 的 prompt context 和工作逻辑被开发者锁死在后台,用户无法访问、修改、自定义。经典的「开发者决定一切,保护用户免受复杂性」思维,本质上是把 AI 的控制权集中在开发者手中,而不是交给用户。


*「Horseless Carriages」这个比喻来自汽车发明初期,早期的汽车在外形上模仿马车,只是把马换成了发动机,而没有根据新技术的特性重新设计交通工具。Pete 用同样的逻辑审视今天的 AI 软件,认为大多数仍然是「在确定性软件里嵌一小块 AI」,本质上还是马车。


Gary:Safetyism,我讨厌这个。


Pete:你再看我在本地用 coding agent 的体验,什么都能做,有超能力。当 AI 越来越成熟,正确方向是 Agent 包裹确定性工具(agent wrapping deterministic tools),而不是确定性软件包裹 AI。AI 最大的潜力在于将软件的控制权从开发者转移到用户手中。我们在内部也在尽力朝这个方向暴露能力给员工,但还有很长的路要走。


Gary:Chat 作为界面也是这个逻辑。我以前觉得 Chat 不是 AI 的最终 UI,改主意了。反思之后,Chat 最接近人类语言,人类语言最接近思维的表达。你不能把它塞进框里,那限制我们太多。Chat 是清晰智能的最近跳板。而且 Chat 是多模态的,文字、语音、图片、文件都行。你越来越信任 Agent,不需要复杂 UI 审查每一步。


Pete:偶尔你确实需要某个特定视图,Agent 可以当场生成一个针对当前需求的单页 JavaScript 应用,用完即弃,这个技能文件可以随时再调用。这就是 just-in-time software(即时软件)。


Gary:我有切身体验。一月到二月我用 Rails 写了约五十万行代码,Gary's List,包括深度研究、语音提取、事实核查整套 agentic 框架。但这是 2013 年的建法,上次我写代码就是 web 2.0 时代。Claude Code 让你可以这样做,但你不必这样做。过去三天我用 Gbrain 重写了同样的能力,大概一万行 TypeScript 加两千行 Markdown。更重要的是它是动态的:我的主编可以用自然语言修改规则,我根本不用碰代码。那五十万行 Rails 僵化、改起来慢十倍。这就是 just-in-time software 的真实体现。


Pete:最好的 AI 软件往往是最小的,只在模型能力之上加最少量的预写代码,让模型做最多的工作。我最喜欢的例子是 Pi,一个极简的开源 Agent harness。代码量极小,但你可以用 Pi 修改和扩展 Pi 自身,这种「自我扩展」的软件形态很迷人。我怀疑未来越来越多商业软件会以这种形式出现,一个极小的起点,加上 Agent 按需扩展。


Gary:Claude Code 也是。每次 Boris 来 YC 分享,最让我印象深的就是他对简洁的执念,让产品尽可能地小。



文章来自于微信公众号 "Founder Park",作者 "Founder Park"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0