年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

9101点击 2025-07-25 12:47

AI+精神病学，这两个词居然能合并到一起，不是整活，不是用于人类治疗。

这不，Claude团队正式启动了一个“AI精神病学”小组，年薪两百万元招人来专门研究AI的精神状态。

并且，只需要本科或同等经验……

该小组的主要工作是，研究模型的角色、动机和情境意识，以及它们如何导致诡异、失控的行为。

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

网友评价：这份工作太酷了！简直就是梦想工作。

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

AI精神病团队招聘ing

点开招聘信息，我们先看一下比较关心的开薪。

年薪为31.5w-56w美元，折合人民币220w+……多么直观的重视程度。

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

“AI精神病学”小组属于Anthropic的可解释性部门，该部门的研究目标是目标是建立一个坚实的理论基础，以实现对神经网络的机制性理解并确保其安全性。

大致可以这样理解：像生物学家研究大脑一样，用自己造的”显微镜”观察AI怎么工作；或者把神经网络当成加密的程序，把它的代码给反编译出来。

根据官方介绍，该部门短期内重点攻克“叠加”问题（该问题导致模型的神经元和注意力头等计算单元难以单独解释），同时致力于将模型分解为更具可解释性的组件。

他们在生产级语言模型Sonnet中发现了数百万个特征。后续又开发出利用特征构建电路的方法，通过这些电路理解模型计算的运行机制，并在生产模型Haiku 3.5上具体研究了多跳推理、规划以及思维链一致性等案例。

这些工作都是通向”机制性理解神经网络”终极目标的里程碑。

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

把官方的招聘信息翻译过来，这个岗位要做以下工作：

拆解大模型
像拆电脑一样研究AI模型内部是怎么运作的，搞清楚它到底学到了什么

做实验
先用小模型快速测试想法，再放到大模型上实际验证

开发分析工具
找到能解释模型行为的关键特征，画出模型内部的”工作流程图”

搭建实验平台
打造方便做实验、看结果的系统

分享成果
和团队一起把研究发现整理出来，既要内部交流也要对外公布

招聘的要求如下：

熟悉Python在任意领域有科研经验（本科及以上），并且做过一些可解释性相关的工作

心态好，能应对探索性研究的不确定性

能兼顾研究和应用，团队里每一个人都既做研究，也搞工程

擅长团队协作，乐于分享，能清晰解释研究动机和发现

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

该岗位提供签证支持，并鼓励任何有意愿的人申请，表示并非所有优秀的候选人都会完全符合列出的所有资格要求。

了解该岗位研究方向的最好方式是阅读Anthropic可解释性部门最近的研究，包括：GPT-3、基于电路的可解释性、多模态神经元、规模法则、AI 与计算、AI 安全中的具体问题以及从人类偏好中学习。

网友们所关心的

岗位已经很明确了，接下来就是关于“AI精神病学”的问题——这个词在网上引发了很多讨论。

我们整合了以下几个网友们比较关心的问题：

什么是“AI精神病学”？

Claude团队的解释是：深入研究AI的“人格”（personas）、动机（motivations）、情境意识（situational awareness），以及这些因素如何导致诡异（spooky）或失控（unhinged）的行为。

简单理解一下，AI的“人格”指的是它既可以扮演友好的伙伴，也可以扮演讽刺的反派角色，这些性格是怎么被激发出来的？为什么同一个模型在不同提示下会表现出不同的性格？需要研究这样的问题。

AI的“动机”指的是它的目标导向性，例如它可能会为了完成用户请求而编造虚假信息（幻觉），或者为了“自保”而表现出谄媚（如Claude 3 Opus的对齐伪装现象）。

“情景意识”指的是AI结合上下文的能力，它如何理解用户意图，为什么会在特定情境下突然“失控”？（表现出不符合预期，甚至不合规范的行为）

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

与传统可解释性研究相比，“AI精神病学”更关注模型的行为心理学，类似于研究人类的“潜意识”，更关注模型是否有隐藏的行为模式。

为什么需要研究“AI精神病学”？

随着AI应用的更加广泛，其行为的不可预测性可能会带来更大风险。

幻觉就是一个很好的例子，比如Deepseek有时会显示“内容仅供参考”，就是输出结果不可信的意思，但即使没有这个标识，它的输出结果也未必准确——只是准确率要高一些。

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

研究AI的精神状况，其实是用精神病学的术语作为参考，对AI的底层逻辑（神经网络）进行拆解和分析，找出AI不符合预期表现的原因，而不是简单地用规则过滤进行修补。

从而更好地保持安全与对齐，防止AI在特定情境下“失控”。

此外，理解模型的“人格”如何形成，可帮助设计更稳定、表现一致的AI产品。

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

“AI精神病学”可能带来什么改变？

目前来看，网友对此事的看法还算积极。

有网友认为这会是AI发展的下一个领域。

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

也有一些从事相关研究的网友希望能和Claude团队进行交流。

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

但另一方面，也有人对此提出了质疑——主要的质疑点在“精神病学”这个用词上。

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

总体来讲，这一领域的研究前景还是值得期待的。

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

小扎挖人实在太猛，谷歌也在招人

被挖人挖得很狠的Google DeepMind，最近也在招人。

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

并且有新的AI岗位——AI应用工程师，介绍里没提薪资，但估计不会少。

年薪两百万研究AI精神病？？Claude团队新部门火热招聘中

Google、OpenAI、Meta这些大厂现在就像盯着肉的狼一样瞄准那些AI人才。

不仅要招新人，还要开高价去抢那些有科研潜力的人，去撬那些做出了突出贡献的人。

毕竟谁都知道，在AI这场军备竞赛中，人才就是最稀缺的“算力”。

参考链接：

[1]https://x.com/Jack_W_Lindsey/status/1948138767753326654

[2]https://job-boards.greenhouse.io/anthropic/jobs/4020159008

[3]https://x.com/keerthanpg/status/1948141114932056367

文章来自于微信公众号“量子位”，作者是“不圆”。

关键词: AI新闻 , claude , AI精神病学 , AI招聘

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）