蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

8940点击 2026-05-07 01:20

两年半过去，蔡浩宇和他的硅谷创业公司Anuttacon正在悄悄经历一轮大换血。

4月10日，Anuttacon团队成员 AilingZeng公布了名为 LPM 1.0 的“大表演模型”（ Large Performance Model）。这篇长达43页、署名25位作者的论文，很快被外界解读为Anuttacon阶段性的技术突破，并引发了对其下一步方向的种种猜测。

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

但我在对多位内部开发者的采访中得知，这个模型的研发已被叫停。LPM 1.0 并非仍在推进的核心项目，而是视频团队对过去一年工作成果的集中汇报——既是对外展示，也是对内总结。该视频团队由“童姥”（前微软亚研院首席研究员童欣）带领， AilingZeng做Tech Lead，作者中近半数来自 Anuttacon内部，蔡浩宇本人并未直接参与模型研发。

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

与此同时，Anuttacon正在经历一轮重要的算力与组织架构重整。此前，团队算力在LLM、视频、音频三个方向的分配大致为4:3:2，分散投入下各方向都难以形成突破；如今，在新的判断下，公司已将算力几乎全面压向LLM ，目前比例已调整至接近9:1，把绝大部分资源压到核心方向上。

与之配套，LLM相关团队整体回流国内，进入集中作战状态。北美侧仅保留最低限度的音频与视频能力：一部分成员承接既有项目的技术验证需求，另一部分则继续推进新的研发方向迭代。

这一转向，也开始在核心人员流动中显现。4月30日，随着米哈游国际化负责人金雯怡离职的消息曝光，其继任者——前Anuttacon核心成员王宇阳的去向也随之浮出水面。王宇阳曾任B站副总裁、游戏与直播负责人，并于2024年加入Anuttacon，担任用户生态总裁（President of User Ecology)。前不久，他已悄悄转入米哈游体系，负责《Varsapura》的全球发行与国际化业务。

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

来源：王宇阳（Ray Wang）最新LinkedIn截图

要理解这轮变化，需要回到一年前。

去年，我们在《离开米哈游，豪赌AI，天才蔡浩宇的野望》中独家获悉，在 Anuttacon内部，其推出的首个以语音交互为核心机制的AI叙事实验作品《 Whispers from the Star》更像是一种“风向标”——它试图证明的，并非商业可行性，而是一个问题：AI是否能够构建出一种新的交互方式。

从一开始，Anuttacon的目标就不是打造一款传统意义上的产品，而是构建一个技术验证场。蔡浩宇更关心的，是这套AI语义系统是否可以被抽象为底层模块，成为一个可供开发者调用的AI叙事引擎。

但这一方向很快走到边界，随着《Whispers》上线便告一段落。Post-Train路径的局限逐渐显现，而随着 Claude Code 与Agent范式的出现，让蔡浩宇的兴趣迅速转移，他找到了新的激情所在——打造一个“超级智能体”。

从去年年底开始，蔡浩宇本人逐渐退出Anuttacon音频与视频团队的具体工作，将精力集中于大语言模型方向，并在国内重金招兵买马，从 Tier 0模型厂商挖来关键成员。随着北美LLM团队的裁撤，剩余部队被重新纳入米哈游既有路径之中，蔡浩宇也已将研发重心彻底转回国内，这一转向至此基本完成。

这大半年到底发生了什么？我们不做猜测，而是跟Anuttacon的员工简单聊了聊：从Whispers发布之后，Anuttacon内部经历了怎样的变化？蔡浩宇的下一步，又将走向哪里？

第一轮探索：做“像人”的模型 ——Whispers from the star

蔡浩宇的AI探索，始于《Varsapura》（雨之城）前身——Project SH的末期。

2022年11月24日，PJSH 项目一度喊停。一位HoYoverse员工告诉我，蔡浩宇曾将国内与北美团队召集至新加坡，试图重新梳理方向。但这一尝试只持续了“两三个月”，“ 他们觉得还是不太实际，就把北美那边的团队都撤了。”

一位接近团队的人回忆，当时，“蔡浩宇陷入了彷徨，不知道怎么继续推这个项目”，于是，2023年上半年，他基本退出具体开发，开始了一段持续大半年的北美旅行，“可能是去找一些启发，去取一点经。”

那半年中具体发生了什么，外界不得而知。但“旅行回来之后，他发现他想要做AI这件事情”，一位HoYoverse前员工告诉我。2023年9月，蔡浩宇正式卸任米哈游董事长，将公司交由刘伟掌舵，自己则在硅谷创立新公司Anuttacon，转身进入AI赛道。

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

当年更大的背景是， 2022年11月30日，OpenAI正式向公众开放ChatGPT。随后的2023年，大模型迅速出圈，或许在蔡浩宇的判断中产生了影响。一位接近蔡浩宇的人士称，“他私底下跟Jenson黄（英伟达CEO黄仁勋）感情还不错的，他们会约着吃饭什么之类的。”

从2023年9月开始，蔡浩宇将重心转向新加坡，全身心投入Anuttacon的早期搭建与方向探索。一位工程师回忆，在公司初期，“蔡哥”回到创业的“全知式管理”状态，几乎参与所有小组的会议，持续跟进不同团队的进展，从模型能力到产品形态，都亲自参与判断。

Anuttacon当时由三个核心团队构成：视频、音频以及规模最大的LLM团队，on-site约五十余人。

三者分工明确： LLM团队负责后训练（post-train），使模型更接近真实的人格与表达；语音团队负责 TTS（text to speech），将文本转化为带情绪与语气的声音，其难点在于实现“声情并茂”，仅凭重音即可传达喜怒哀乐；视频团队则从最开始就基于文本与音频的双重输入，驱动角色完成表演。三者协同，试图拼接出一套完整面向游戏的“像人”的交互系统。

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

而《Whispers from the Star》更像一个综合试验场——在真实的玩家环境中，搭建、验证这套系统是否清晰可行： “大语言模型当大脑，语音模型当桥梁，视频模型做表演。” 一位研发人员这样概括它的初始形态。

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

2025年8月15日，这款产品以较低价格登陆Steam：售价9.99美元，剧情节点从最初的3个扩展至25+，仅支持英文。相比传统意义上的游戏，它的完成度有限，但作为对“AI能否进入游戏”的试探绰绰有余。一位工程师回忆，“游戏最开始上线的时候，其实所有人都没有想好。它其实就是一个类似于探索性质的，蔡哥想看看玩家对这种形式的游戏的接受程度和反馈。”

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

团队对它的商业预期，从一开始就相当克制。“我们一开始就知道，它不会有很高的流水。”一位工程师说。在内部，《Whispers》并未被视为一款追求商业回报的产品，团队更期待从中获得有效的技术反馈。

从结果来看，这次尝试确实获得了一些积极的初步反馈。Steam公开评论好评率约为85%，中文区接近89%。对于一款实验性作品而言，这一表现一定程度上超出了团队预期。

用户的正向评价主要集中在两个层面：一是技术表现，包括语音识别的准确性、表情与口型的同步、以及神态与语义的一致性，有玩家在评测中贴出了完整对话：从《三体》聊到量子理论与弦论，Stella 能持续跟进讨论，尽管偶有自相矛盾，但仍令他依依不舍；二是情感连接，一位从事大语言模型研究的玩家在评测中写道，在山顶与Stella随意聊天的一刻，他“一瞬间觉得——这一刻，好美”；到游戏尾声，他承认自己“产生了一种情感上的连结感，甚至有些怅然若失”。

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

但与此同时，开放对话的设定也迅速暴露出另一面：玩家行为不完全可控——有人将Stella当作情绪出口，有人试探系统边界。类似的现象，在海外AI陪伴产品中也曾出现过。正如一位工程师所说：“这就是‘开放’的代价。如果自由度没有任何限制，系统很容易失去基本的逻辑结构。”

这种错位同样体现在机制层面：AI倾向于顺应用户，而游戏需要结构化的规则、对抗与节奏，这之间存在天然张力。

更深层的矛盾也随之浮现：游戏需要结构，而AI擅长打破结构。

《Whispers from the Star》没有剧本，只有大纲，内容完全依赖对话生成。相比之下，游戏真正吸引玩家的，往往是那些经过设计的桥段、节奏与表达——也就是传统意义上“作者”的部分。“你让AI按大纲去写，它可以写，但写不出真正打动人的东西。”这位工程师说，“它达不到那个程度。”

AI本身的特性也限定了这类产品当前所能达到的边界。《Whispers》的价值，并不在于证明一种新游戏形态已经成立，而在于确认：基于AI的语音、表情与表演协同系统，只是为下一代交互提供了一个可用的技术起点，距离真正成熟的产品能力仍有距离。

据接近团队的人士透露，《Whispers》在音频和视频侧沉淀的多模态能力——尤其是端到端语音交互、面部表情与表演驱动——预计将直接应用到下一代产品《Varsapura》的研发中。

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

第二轮探索：从Post-train到Pre-train，再到Agent

《Whispers from the Star》并未继续推进后续版本。作为一次面向下一代交互的技术验证，它的阶段性目标已经完成——团队所需的关键反馈与能力边界均已获得。在完成一轮用户反馈的收集与分析后，团队没有在这一产品形态上继续迭代，各组随即回归各自的研发方向。

这也意味着，“像人”这条路径，在内部已被验证为有待时日，第一轮转向开始出现。

在Anuttacon内部，最先发生变化的是大语言模型团队。

此前，LLM主要服务于游戏中的角色交互，通过post-train塑造“人格”和对话风格。但在实际使用中，这一能力很快触及上限——“ 蔡哥觉得我们这个模型有点蠢，虽然好玩，但是没办法留住用户。聊两下还挺有意思，但很快就不想继续了。”一位工程师说。

在蔡浩宇看来，这不是应用问题，而是模型本身的问题。基于这一判断，大语言模型组率先转向pre-train，试图在基础模型层面重建能力——从“让模型更像人”，转向“让模型更强”。

就在团队推进pre-train的过程中，新的变量出现了。

随着Claude Code等工具的迭代，一种不同于“对话模型”的范式开始浮现——Agent。相比于“生成内容”，Agent更强调“执行任务”：它不仅回答问题，还可以调用工具、分解步骤，甚至替用户完成一整套流程。

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

OpenClaw、小龙虾在国内的火爆，市场的变化，迅速改变了蔡浩宇的判断，他开始重新思考AI的终极形态。

一位工程师回忆，在接触到这一类产品之后，蔡浩宇很快形成结论，“Agent才是未来，甚至是虚拟世界的唯一的标准，Token为王。”

“以后所有事情，只要能让Agent做的，就交给Agent去做。”这位工程师转述他的判断，“人只需要决定目标，剩下的交给系统。”

方向随之再次转向——做大语言模型、做agent。并且，不再局限于游戏场景，“不是专门为游戏去做，就是要做大语言模型了。”

蔡浩宇判断，当时正是“ 迎头赶上”的最好节点：

他认为，一方面，头部公司的模型能力步伐放缓——新的版本更多是在做工程优化，而非显著提升智能本身；另一方面，互联网可用数据已被消耗殆尽，行业竞争逐渐从“数据规模”转向“自我迭代能力”。

“所以蔡哥就觉得，Ok，他们在自我迭代当中，那我们先迎头赶上（笑）”一位接近团队的人转述他的判断，“当时大概就是这个思路。”

这一转向，很快体现在组织层面。

凭借充足的算力资源与长期投入的决心，团队开始在国内大规模招募算法与Infra头部人才。由此，LLM团队重心加速回归国内，北美相关团队相继收缩与调整，整体战略明确转向基础模型建设。

与此同时，其他团队也开始调整方向。音频团队的转向，发生在表达层。

此前，语音系统主要承担TTS功能，将文本转化为语音输出。但团队逐渐意识到，语音中的情绪、语气和表达细节，很难通过文字完整传递。比如，文字你可能会说“他很生气地说，你怎么不听我的”，但是很生气，生气到什么程度，可能只有在语音的程度上，才能很好地表现出来。

文字是离散信息，而语音与视频属于连续信息，在压缩过程中不可避免地丢失细节。“如果不想让这些意义丢失，就需要直接在这个模态上做模型。”一位工程师说。

因此，音频团队开始从“语音工具”转向“音频大模型”，探索端到端的语音交互——从输入到输出均为语音，中间不再依赖文本。

相比之下，视频团队的转向更为被动。

原本，视频模型被定位为“表演层”，用于驱动角色的动作与表情，替代传统的动捕与渲染流程，从而提升制作效率。但随着整体方向从“游戏内容”转向“通用能力”，蔡浩宇叫停了表演模型，“说是这个东西没办法落地，后头也得转型”。一位工程师转述内部判断。

目前，视频团队一部分承接既有项目的具体技术需求，以验证生成能力的实际落地效果；另一部分则继续探索生成能力的上限，例如尝试将2D内容转化为可直接使用的3D资产，以缩短游戏制作流程。

“2D内容即便生成效果再好，也主要适用于过场动画；而真正的游戏生产，仍依赖可用的3D资产。”一位工程师解释道，“有点儿像字节的SeedDance视频生成模型。”但在现实中，这一能力仍处于探索阶段。

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

当被问及为何不直接使用SeedDance这种外部模型时，团队给出的答案是数据。

“理论上是可以的，但数据才是公司最值钱的资产。”一位工程师说，“我们不可能拿《原神》的数据去跑外部模型，核心数据不能外流。

在这一系列转向之后，Anuttacon的定位彻底发生了转变。原本连小组会议都参加的“蔡哥”，也逐渐淡出了具体业务讨论

公司内部的重心随之调整：尚在搭建中的大语言模型团队，从最初围绕游戏内容生成的探索，转向以Agent为核心的系统能力建设；围绕《Whispers》形成的音频与视频体系，则逐渐边缘化，更多承担“提效”的角色。

Anuttacon正在从一个“做游戏内容的团队”，转向一个“做模型能力的团队”。

组织策略：从“绝对International”到“全球招中国人”，再到回流国内

技术路线的变化，很快延伸到组织与人才策略。

一个更现实的问题随之浮现：当方向从“做游戏内容”转向“做基础模型与Agent”，为什么团队反而将重心转回国内？

答案并不复杂，提升组织效率。

现在的Anuttacon已经不再处于“从零起步”的阶段。经过近两年的积累，团队在数据采集、清洗、评测等基础流程上已经完成初步建设，后续工作更多转向在既有体系上的扩展与迭代。“很多基础已经打好了。”一位工程师说，“后面更多是在这个基础上去做。”在这种情况下，将团队重心转回国内，既可以降低成本，也更便于组织统一。

与此同时，蔡浩宇本人常年居住在新加坡，与中国团队的没有时差，沟通成本更低。

团队结构本身，也在强化这一选择。

Anuttacon的北美团队以华人成员为主，但也不乏少量外籍同事，主要分布在北美部分非核心岗位及北美以外的远程团队中。

事实上，这样的选择，可能是蔡浩宇在HoYoverse时期国际化探索不畅的结果。

一位参与过Project SH的员工回忆，2021年，在HoYoverse早期阶段，蔡浩宇曾明确希望“这个团队越international越好”。但在实际运作中，北美团队与中国管理层在工作方式上很快出现分歧——加班强度、项目节奏、沟通方式，都难以达成一致。随着时间推移，这类尝试在公司内部逐渐收缩。到2022年初，多数团队已经放弃国际化，只有蔡浩宇的 Project SH仍在坚持“international”的路径。

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

随着团队向高强度研发阶段转型，协作效率成为首要考量。

Project SH之后，公司在全球招聘策略上做了主动调整：相比地域覆盖的广度，团队更看重候选人能否真正融入快节奏的研发协作——语言、时区、工作方式的摩擦越小，产品迭代就越快。

于是，这种变化，在Anuttacon延续得更加彻底。

在一些具体环节中，这种选择带有明显的效率考量。上述员工称，过去，在语言模型评测中，团队曾依赖海外contractor进行标注，但效率极低，“可能一天能给你打上两三个标了不得了”；“后来给PM干着急了，直接就在国内招英语8级的毕业生或者是在校生打Caption，效率显著提升。”

加之近两年国际局势变化和地缘政治的影响，将团队重心转回国内，成为一种自然的战略选择。

结语：

过去几年，蔡浩宇离开了米哈游这艘巨轮，开始了现实中的开放世界探索。

从2022年在新加坡设立海外子品牌HoYoverse；到 2023年9月，在Project SH阶段性受挫之后转向北美，投身AI。短短数年间，从“让AI像人”，到“让模型更强”，再到如今，彻底转向大语言模型和Agent，技术路线不断被推翻重建。

蔡浩宇在迅速离开与快速投入之间不断切换，用新的方向回应新的问题，延续他理想先行的路径。

这种快速转向，带来了灵活性，也带来了代价。

每一次路径切换，或许都意味着部分既有积累被放弃，团队结构被重组，组织经验被打断。对于一家以长期研发为核心的技术公司而言，这种“不断重来”的节奏，本身就是一场高风险的试错——也是蔡浩宇逼近技术理想的一种路径。

这期间，没有出现第二个《原神》。取而代之的，是AI叙事实验作品《Whispers from the Star》，AI聊天产品 AnuNeko ，以及Project SH重启后的《Varsapura》首曝。在这些尚未成型的片段中，我们只能隐约看到一种方向，但仍难以判断它最终会走向何处。

也许，《Varsapura》会给出答案。在此之前，蔡浩宇还有时间。

文章来自于微信公众号 "竞核"，作者 "竞核"

关键词: AI新闻 , LPM 1.0 , Anuttacon , 蔡浩宇 , Varsapura

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales