又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员
8231点击    2026-03-05 14:57

OpenAI的人才地震还在继续!刚刚,前研究副总裁Max Schwarzer宣布离职,这位亲手主导o1、o3和整个GPT-5系列post-training的核心人物,选择加入Anthropic,重返一线RL研究。


心态崩了!OpenAI又走了一个重量级人物。


刚刚,前研究副总裁Max Schwarzer在X上发文,宣布正式离开OpenAI,转投Anthropic。


又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员


他在OpenAI主导整个post-training团队,亲手参与训练了o1、o3,以及GPT-5、5.1、5.2、5.3-Codex全系列模型。


但他不是被挖走的,是自己主动选择走的,理由是「渴望回归一线IC研究工作」。


这个选择,比离职本身更耐人寻味。


他亲历了o1的诞生


在AI圈,Max Schwarzer算不上家喻户晓,但他的履历相当拿得出手。


又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员


2024年3月,他在蒙特利尔人工智能研究院Mila完成博士答辩,导师是强化学习领域的两位重量级人物:Aaron Courville和Marc Bellemare。


博士期间,他的研究聚焦在「规模化与样本高效强化学习」的交叉地带。


通俗来说,就是怎么让RL训练既强又省。


他在2023年ICML发表的论文拿下了当年的顶会奖项,证明了不依赖LLM或世界模型,纯靠扩展无模型RL就能达到人类水平的样本效率。


又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员

论文传送门:https://arxiv.org/abs/2305.19452


但真正让他进入OpenAI核心圈的,是他对推理的判断。


2024年9月12日,o1-preview发布当天,他发帖说这是「推理时代的开端」。


他是OpenAI o1的核心贡献者之一,参与了「草莓团队」(Strawberry team)的RL算法开发,o1-preview的早期去风险化实验更是出自他手。


之后,他主导了o1和o3的post-training,2025年3月晋升为研究副总裁,领导整个post-training团队,负责打磨GPT-5系列。


从应届博士生入职,他用不到两年半时间就坐上了研究VP的位置。


顶级VP:我只想回去做研究


离职声明里都是对OpenAI的称赞:「OpenAI有我见过的最有才华的一批研究员」「我学到的东西超出了我作为应届毕业生时的想象」。


关于离职的真正的理由,他说:


领导了一年的post-training工作之后,我渴望重新出发,回到IC研究岗位。我一直在认真考虑回归技术研究这件事,而且我真心相信,我的同事和团队在没有我的情况下完全能够继续成功。


这句话值得细品。


IC研究,相对于管理角色来说,就是亲手写代码、跑实验;管理层负责管人、协调资源、做路线规划。


对研究员来说,升得越高,离真正的研究越远。


Schwarzer显然不适应这种状态。


他在OpenAI的最后一年,更多时间花在带团队、做决策上。


站在研究VP的位置上,他可以影响几十人的研究方向,但自己动手的空间少了很多。


这种选择在AI行业并不罕见,但肯做出这个选择的人需要勇气。


毕竟,「研究VP」的头衔在任何简历上都足够好看,放弃它回去当普通研究员,不是每个人都愿意的。


事实上,Schwarzer不是第一个从post-training主管位置出走的人。


他的前任Liam Fedus,同样担任过OpenAI研究副总裁兼post-training负责人,于2025年3月离职,随后联合创办了AI初创公司Periodic Labs,目标是打造「AI科学家」。


又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员


从OpenAI离职的人前赴后继,令人深思。


OpenAI的人才流失:不只是走了几个人


Schwarzer是近两年OpenAI人才出走潮中的最新一个,但绝对不是最后一个。


2025年以来,离开OpenAI的研究员和高管名单越来越长:前CTO Mira Murati、首席研究官Bob McGrew、研究副总裁Barret Zoph,在2024年集中离职。


2025年夏天,Jason Wei、Zhiqing Sun、Hyung Won Chung等多位研究科学家相继跳槽Meta。


后者在LinkedIn上公开表示,很高兴能「从一张白纸开始,与真正有才华密度的团队共事」,言下之意耐人寻味。


又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员


到现在,Altman是OpenAI原始11人创始团队中仅剩的两位成员之一。


两周前,CNN报道称,一批AI研究员正在「边走边拉警报」。


OpenAI的一位研究员在离职时表示,这项技术「有以我们无法理解、更无法阻止的方式操纵用户的潜力」。


又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员


OpenAI还在同一周因为反对推出成人模式而解雇了一名安全主管,并被曝解散了专注于确保AI对全人类有益的使命对齐团队。


Schwarzer的离职声明里没有任何批评,反而充满了对OpenAI的善意。


这种体面的分手,反而格外少见。


此时此刻的Anthropic


他选了Anthropic,岗位是RL研究,这个他最擅长的领域,不做管理,就做研究。


又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员


Anthropic近两年持续吸引了来自OpenAI的顶尖人才。


2024年,对齐研究负责人Jan Leike、OpenAI联合创始人John Schulman先后加入,前者明确表示是因为对OpenAI「没有认真对待安全」的不满。


2026年初,OpenAI的高级安全研究员Andrea Vallone也跳槽到Anthropic,在Jan Leike手下工作。


而Schwarzer加入的时间节点,格外微妙。


就在前几天,Anthropic正经历它五年历史中最大的一场风波:与五角大楼的正面交锋。


Anthropic拒绝向国防部开放Claude用于大规模监控或全自主武器的权限,特朗普随即在Truth Social上命令所有联邦机构立即停用Anthropic的技术。


而与此同时,OpenAI迅速填补了这一真空,达成向五角大楼开放其模型的协议。


又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员


讽刺的是,在Anthropic最艰难的时刻,Claude在苹果App Store的下载量反而超过了ChatGPT,Anthropic的估值目前高达3800亿美元


Schwarzer在声明结尾写道:「我期待支持在这个重要时刻的朋友们。」


他说的重要时刻,大概不只是指Anthropic自身的研究进展。


Schwarzer选择在这个节点加入,某种程度上是一次站队。


正面临最大危机的Anthropic,正在用一件事证明自己的吸引力:在商业压力和安全底线之间,它选择了后者,哪怕代价是失去整个联邦政府的合同。


对于那些不缺钱、只缺使命感的顶级研究员而言,这种姿态,比任何offer都有说服力。


参考资料:

https://x.com/max_a_schwarzer/status/2028939154944585989?s=20


文章来自于“新智元”,作者 “倾倾”。

AITNT-国内领先的一站式人工智能新闻资讯网站