蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体
8146点击    2026-05-07 01:20

蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体


两年半过去,蔡浩宇和他的硅谷创业公司Anuttacon正在悄悄经历一轮大换血。

4月10日,Anuttacon团队成员 AilingZeng公布 了名为 LPM 1.0 的“大表演模型”( Large Performance Model)。这篇长达43页、署名25位作者的论文,很快被外界解读为Anuttacon阶段性的技术突破,并引发了对其下一步方向的种种猜测。


蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体

但我在对多位内部开发者的采访中得知,这个模型的研发已被叫停。LPM 1.0 并非仍在推进的核心项目,而是视频团队对过去一年工作成果的集中汇报——既是对外展示,也是对内总结。该视频团队由“童姥”( 前微软亚研院首席研究员童欣) 带领, AilingZeng做Tech Lead,作者中近半数来自 Anuttacon内部,蔡浩宇本人并未直接参与模型研发。


蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体


与此同时,Anuttacon正在经历一轮重要的算力与组织架构重整。此前,团队算力在LLM、视频、音频三个方向的分配大致为4:3:2,分散投入下各方向都难以形成突破;如今,在新的判断下, 公司已将算力几乎全面压向LLM ,目前比例已调整至接近9:1,把绝大部分资源压到核心方向上。

与之配套,LLM相关团队整体回流国内,进入集中作战状态。北美侧仅保留最低限度的音频与视频能力:一部分成员承接既有项目的技术验证需求,另一部分则继续推进新的研发方向迭代。

这一转向,也开始在核心人员流动中显现。4月30日,随着米哈游国际化负责人金雯怡离职的消息曝光,其继任者——前Anuttacon核心成员王宇阳 的去向也随之浮出水面 王宇阳曾任B站副总裁、游戏与直播负责人,并于2024年加入Anuttacon,担任用户生态总裁(President of User Ecology)。前不久,他已悄悄转入米哈游体系,负责《Varsapura》的全球发行与国际化业务。


蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体


蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体


来源:王宇阳(Ray Wang)最新LinkedIn截图

要理解这轮变化,需要回到一年前。

去年,我们在《 离开米哈游,豪赌AI,天才蔡浩宇的野望》中独家获悉,在 Anuttacon内部,其推出的首个 以语音交互为核心机制的AI叙事实验作品 Whispers from the Star》更像是一种“风向标”——它试图证明的,并非商业可行性,而是一个问题:AI是否能够构建出一种新的交互方式。

从一开始,Anuttacon的目标就不是打造一款传统意义上的产品, 而是构建一个技术验证场。 蔡浩宇更关心的,是这套AI语义系统是否可以被抽象为底层模块,成为一个可供开发者调用的AI叙事引擎。

但这一方向很快走到边界,随着《Whispers》上线便告一段落。Post-Train路径的局限逐渐显现,而随着 Claude Code 与Agent范式的出现,让蔡浩宇的兴趣迅速转移,他找到了新的激情所在——打造一个“超级智能体”。

从去年年底开始,蔡浩宇本人逐渐退出Anuttacon音频与视频团队的具体工作,将精力集中于大语言模型方向,并在国内重金招兵买马,从 Tier 0模型厂商 挖来关键成员。随着北美LLM团队的裁撤,剩余部队 被重新纳入米哈游既有路径之中, 蔡浩宇也已将研发重心彻底转回国内, 这一转向至此基本完成。

这大半年到底发生了什么?我们不做猜测,而是跟Anuttacon的员工简单聊了聊: 从Whispers发布之后,Anuttacon内部经历了怎样的变化?蔡浩宇的下一步,又将走向哪里?

第一轮探索:做“像人”的模型 ——Whispers from the star


蔡浩宇的AI探索,始于《Varsapura》(雨之城)前身——Project SH的末期。

2022年11月24日,PJSH 项目一度喊停。 一位HoYoverse员工告诉我, 蔡浩宇 曾将 国内与北美团队召集至新加坡,试图重新梳理方向。但这一尝试只持续了“两三个月”,“ 他们觉得还是不太实际,就把北美那边的团队都撤了。”

一位接近团队的人回忆,当时,“蔡浩宇陷入了彷徨,不知道怎么继续推这个项目”,于是,2023年上半年,他基本退出具体开发,开始了一段持续大半年的北美旅行,“可能是去找一些启发,去取一点经。”

那半年中具体发生了什么,外界不得而知。但“旅行回来之后,他发现他想要做AI这件事情”,一位HoYoverse前员工告诉我。2023年9月,蔡浩宇正式卸任米哈游董事长,将公司交由刘伟掌舵,自己则在硅谷创立新公司Anuttacon,转身进入AI赛道。


蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体


当年更大的背景是, 2022年11月30日,OpenAI正式向公众开放ChatGPT。随后的2023年,大模型迅速出圈,或许在蔡浩宇的判断中产生了影响。一位接近蔡浩宇的人士称,“他私底下跟Jenson黄(英伟达CEO黄仁勋)感情还不错的,他们会约着吃饭什么之类的。”

从2023年9月开始,蔡浩宇将重心转向新加坡,全身心投入Anuttacon的早期搭建与方向探索。 一位工程师回忆,在公司初期,“蔡哥”回到创业的“全知式管理”状态,几乎参与所有小组的会议,持续跟进不同团队的进展,从模型能力到产品形态,都亲自参与判断。

Anuttacon当时由三个核心团队构成:视频、音频以及规模最大的LLM团队,on-site约五十余人。

三者分工明确: LLM团队负责后训练 (post-train), 使模型更接近真实的人格与表达;语音团队负责 TTS(text to speech), 将文本转化为带情绪与语气的声音, 其难点在于实现“声情并茂”,仅凭重音即可传达喜怒哀乐; 视频团队则从最开始就基于文本与音频的双重输入,驱动角色完成 表演。三者协同,试图拼接出一套完整面向游戏的“像人”的交互系统。


蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体


而《Whispers from the Star》更像一个综合试验场——在真实的玩家环境中,搭建、验证这套系统是否清晰可行: “大语言模型当大脑,语音模型当桥梁,视频模型做表演。” 一位研发人员这样概括它的初始形态。


蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体


2025年8月15日,这款产品以较低价格登陆Steam:售价9.99美元,剧情节点从最初的3个扩展至25+,仅支持英文。相比传统意义上的游戏,它的完成度有限,但作为对“AI能否进入游戏”的试探绰绰有余。一位工程师回忆,“游戏最开始上线的时候,其实所有人都没有想好。 它其实就是一个类似于探索性质的, 蔡哥想看看玩家对这种形式的 游戏的接受程度和反馈。”


蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体


团队对它的商业预期,从一开始就相当克制。“我们一开始就知道,它不会有很高的流水。”一位工程师说。 在内部,《Whispers》并未被视为一款追求商业回报的产品,团队更期待从中获得有效的技术反馈。

从结果来看,这次尝试确实获得了一些积极的初步反馈。Steam公开评论好评率约为85%,中文区接近89%。 对于一款实验性作品而言,这一表现一定程度上超出了团队预期。

用户的正向评价主要集中在两个层面:一是技术表现,包括语音识别的准确性、表情与口型的同步、以及神态与语义的一致性, 有玩家在评测中贴出了完整对话:从《三体》聊到量子理论与弦论,Stella 能持续跟进讨论,尽管偶有自相矛盾,但仍令他依依不舍 ;二是情感连接, 一位从事大语言模型研究的玩家在评测中写道,在山顶与Stella随意聊天的一刻,他“一瞬间觉得——这一刻,好美”;到游戏尾声,他承认自己“产生了一种情感上的连结感,甚至有些怅然若失”。


蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体


但与此同时,开放对话的设定也迅速暴露出另一面:玩家行为不完全可控——有人将Stella当作情绪出口,有人试探系统边界。类似的现象,在海外AI陪伴产品中也曾出现过。正如一位工程师所说:“这就是‘开放’的代价。如果自由度没有任何限制,系统很容易失去基本的逻辑结构。”

这种错位同样体现在机制层面:AI倾向于顺应用户,而游戏需要结构化的规则、对抗与节奏,这之间存在天然张力。

更深层的矛盾也随之浮现:游戏需要结构,而AI擅长打破结构。

《Whispers from the Star》没有剧本,只有大纲,内容完全依赖对话生成。 相比之下,游戏 真正吸引玩家的,往往是那些经过设计的桥段、节奏与表达——也就是传统意义上“作者”的部分。“你让AI按大纲去写,它可以写,但写不出真正打动人的东西。”这位工程师说,“它达不到那个程度。”

AI本身的特性也限定了这类产品当前所能达到的边界。《Whispers》的价值,并不在于证明一种新游戏形态已经成立,而在于确认:基于AI的语音、表情与表演协同系统,只是为下一代交互提供了一个可用的技术起点,距离真正成熟的产品能力仍有距离。

据接近团队的人士透露,《Whispers》在音频和视频侧沉淀的多模态能力——尤其是端到端语音交互、面部表情与表演驱动——预计将直接应用到下一代产品《Varsapura》的研发中。


蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体


第二轮探索:从Post-train到Pre-train,再到Agent


《Whispers from the Star》并未继续推进后续版本。作为一次面向下一代交互的技术验证,它的阶段性目标已经完成——团队所需的关键反馈与能力边界均已获得。在完成一轮用户反馈的收集与分析后,团队没有在这一产品形态上继续迭代,各组随即回归各自的研发方向。

这也意味着,“像人”这条路径,在内部已被验证为有待时日,第一轮转向开始出现。

在Anuttacon内部,最先发生变化的是大语言模型团队。

此前,LLM主要服务于游戏中的角色交互,通过post-train塑造“人格”和对话风格。但在实际使用中,这一能力很快触及上限——“ 蔡哥觉得我们这个模型有点蠢,虽然好玩,但是没办法留住用户 。聊两下还挺有意思,但很快就不想继续了。”一位工程师说。

在蔡浩宇看来,这不是应用问题,而是模型本身的问题。基于这一判断,大语言模型组率先转向pre-train,试图在基础模型层面重建能力——从“让模型更像人”,转向“让模型更强”。

就在团队推进pre-train的过程中,新的变量出现了。

随着Claude Code等工具的迭代,一种不同于“对话模型”的范式开始浮现——Agent。相比于“生成内容”,Agent更强调“执行任务”:它不仅回答问题,还可以调用工具、分解步骤,甚至替用户完成一整套流程。

蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体


OpenClaw、小龙虾在国内的火爆,市场的变化,迅速改变了蔡浩宇的判断,他开始重新思考AI的终极形态。

一位工程师回忆,在接触到这一类产品之后,蔡浩宇很快形成结论,“Agent才是未来,甚至是虚拟世界的唯一的标准,Token为王。”

“以后所有事情,只要能让Agent做的,就交给Agent去做。”这位工程师转述他的判断,“人只需要决定目标,剩下的交给系统。”

方向随之再次转向——做大语言模型、做agent。并且,不再局限于游戏场景,“不是专门为游戏去做,就是要做大语言模型了。”

蔡浩宇判断,当时正是“ 迎头赶上”的最好节点

他认为,一方面,头部公司的模型能力步伐放缓——新的版本更多是在做工程优化,而非显著提升智能本身;另一方面,互联网可用数据已被消耗殆尽,行业竞争逐渐从“数据规模”转向“自我迭代能力”。

“所以蔡哥就觉得,Ok,他们在自我迭代当中,那我们先迎头赶上(笑)”一位接近团队的人转述他的判断,“当时大概就是这个思路。”

这一转向,很快体现在组织层面。

凭借充足的算力资源与长期投入的决心,团队开始在国内大规模招募算法与Infra头部人才。由此,LLM团队重心加速回归国内,北美相关团队相继收缩与调整,整体战略明确转向基础模型建设。

与此同时,其他团队也开始调整方向。音频团队的转向,发生在表达层。

此前,语音系统主要承担TTS功能,将文本转化为语音输出。但团队逐渐意识到,语音中的情绪、语气和表达细节,很难通过文字完整传递。比如,文字你可能会说“他很生气地说,你怎么不听我的”,但是很生气,生气到什么程度,可能只有在语音的程度上,才能很好地表现出来。

文字是离散信息,而语音与视频属于连续信息,在压缩过程中不可避免地丢失细节。“如果不想让这些意义丢失,就需要直接在这个模态上做模型。”一位工程师说。

因此,音频团队开始从“语音工具”转向“音频大模型”,探索端到端的语音交互——从输入到输出均为语音,中间不再依赖文本。

相比之下,视频团队的转向更为被动。

原本,视频模型被定位为“表演层”,用于驱动角色的动作与表情,替代传统的动捕与渲染流程,从而提升制作效率。但随着整体方向从“游戏内容”转向“通用能力”,蔡浩宇叫停了表演模型,“说是这个东西没办法落地,后头也得转型”。一位工程师转述内部判断。

目前,视频团队一部分承接既有项目的具体技术需求,以验证生成能力的实际落地效果;另一部分则继续探索生成能力的上限,例如尝试将2D内容转化为可直接使用的3D资产,以缩短游戏制作流程。

“2D内容即便生成效果再好,也主要适用于过场动画;而真正的游戏生产,仍依赖可用的3D资产。”一位工程师解释道,“有点儿像字节的SeedDance视频生成模型。”但在现实中,这一能力仍处于探索阶段。


蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体

当被问及为何不直接使用SeedDance这种外部模型时,团队给出的答案是数据。

“理论上是可以的,但数据才是公司最值钱的资产。”一位工程师说,“我们不可能拿《原神》的数据去跑外部模型,核心数据不能外流。

在这一系列转向之后,Anuttacon的定位彻底发生了转变。原本连小组会议都参加的“蔡哥”,也逐渐淡出了具体业务讨论

公司内部的重心随之调整:尚在搭建中的大语言模型团队,从最初围绕游戏内容生成的探索,转向以Agent为核心的系统能力建设;围绕《Whispers》形成的音频与视频体系,则逐渐边缘化,更多承担“提效”的角色。

Anuttacon正在从一个“做游戏内容的团队”,转向一个“做模型能力的团队”。


组织策略:从“绝对International”到“全球招中国人”,再到回流国内


技术路线的变化,很快延伸到组织与人才策略。

一个更现实的问题随之浮现:当方向从“做游戏内容”转向“做基础模型与Agent”,为什么团队反而将重心转回国内?

答案并不复杂,提升组织效率。

现在的Anuttacon已经不再处于“从零起步”的阶段。经过近两年的积累,团队在数据采集、清洗、评测等基础流程上已经完成初步建设,后续工作更多转向在既有体系上的扩展与迭代。“很多基础已经打好了。”一位工程师说,“后面更多是在这个基础上去做。”在这种情况下,将团队重心转回国内,既可以降低成本,也更便于组织统一。

与此同时,蔡浩宇本人常年居住在新加坡,与中国团队的没有时差,沟通成本更低。

团队结构本身,也在强化这一选择。

Anuttacon的北美团队 以华人成员为主 ,但也不乏 少量外籍同事,主要分布在北美部分非核心岗位及北美以外的远程团队中。

事实上,这样的选择,可能是蔡浩宇在HoYoverse时期国际化探索不畅的结果。

一位参与过Project SH的员工回忆,2021年,在HoYoverse早期阶段,蔡浩宇曾明确希望“这个团队越international越好”。但在实际运作中,北美团队与中国管理层在工作方式上很快出现分歧——加班强度、项目节奏、沟通方式,都难以达成一致。 随着时间推移,这类尝试在公司内部逐渐收缩。到2022年初,多数团队已经放弃国际化,只有 蔡浩宇的 Project SH仍在坚持“international”的路径。


蔡浩宇美国公司换血背后:裁撤大模型团队,押注超级智能体


随着团队向高强度研发阶段转型,协作效率成为首要考量。

Project SH之后,公司在全球招聘策略上做了主动调整:相比地域覆盖的广度,团队更看重候选人能否真正融入快节奏的研发协作——语言、时区、工作方式的摩擦越小,产品迭代就越快。

于是,这种变化,在Anuttacon延续得更加彻底。

在一些具体环节中,这种选择带有明显的效率考量。上述员工称,过去,在语言模型评测中,团队曾依赖海外contractor进行标注,但效率极低,“可能一天能给你打上两三个标了不得了”;“后来给PM干着急了,直接就在国内招英语8级的毕业生或者是在校生打Caption,效率显著提升。”

加之近两年国际局势变化和地缘政治的影响, 将团队重心转回国内,成为一种自然的战略选择。

结语:


过去几年,蔡浩宇离开了米哈游这艘巨轮,开始了现实中的开放世界探索。

从2022年在新加坡设立海外子品牌HoYoverse;到 2023年9月,在Project SH阶段性受挫之后转向北美,投身AI。 短短数年间,从“让AI像人”,到“让模型更强”,再到如今,彻底转向大语言模型和Agent,技术路线不断被推翻重建。

蔡浩宇在迅速离开与快速投入之间不断切换,用新的方向回应新的问题,延续他理想先行的路径。

这种快速转向,带来了灵活性,也带来了代价。

每一次路径切换,或许都意味着部分既有积累被放弃,团队结构被重组,组织经验被打断。对于一家以长期研发为核心的技术公司而言,这种“不断重来”的节奏, 本身就是一场高风险的试错——也是蔡浩宇逼近技术理想的一种路径。

这期间,没有出现第二个《原神》 。取而代之的,是AI叙事实验作品《Whispers from the Star》,AI聊天产品 AnuNeko 以及Project SH重启后的《Varsapura》首曝。在这些尚未成型的片段中,我们只能隐约看到一种方向,但仍难以判断它最终会走向何处。

也许,《Varsapura》会给出答案。在此之前,蔡浩宇还有时间。



文章来自于微信公众号 "竞核",作者 "竞核"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales