年薪两百万研究AI精神病??Claude团队新部门火热招聘中

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
年薪两百万研究AI精神病??Claude团队新部门火热招聘中
6114点击    2025-07-25 12:47

AI+精神病学,这两个词居然能合并到一起,不是整活,不是用于人类治疗。


这不,Claude团队正式启动了一个“AI精神病学”小组,年薪两百万元招人来专门研究AI的精神状态


并且,只需要本科或同等经验……


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


该小组的主要工作是,研究模型的角色、动机和情境意识,以及它们如何导致诡异、失控的行为。


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


网友评价:这份工作太酷了!简直就是梦想工作。


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


AI精神病团队招聘ing


点开招聘信息,我们先看一下比较关心的开薪。


年薪为31.5w-56w美元,折合人民币220w+……多么直观的重视程度。


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


“AI精神病学”小组属于Anthropic的可解释性部门,该部门的研究目标是目标是建立一个坚实的理论基础,以实现对神经网络的机制性理解并确保其安全性


大致可以这样理解:像生物学家研究大脑一样,用自己造的”显微镜”观察AI怎么工作;或者把神经网络当成加密的程序,把它的代码给反编译出来。


根据官方介绍,该部门短期内重点攻克“叠加”问题(该问题导致模型的神经元和注意力头等计算单元难以单独解释),同时致力于将模型分解为更具可解释性的组件。


他们在生产级语言模型Sonnet中发现了数百万个特征。后续又开发出利用特征构建电路的方法,通过这些电路理解模型计算的运行机制,并在生产模型Haiku 3.5上具体研究了多跳推理、规划以及思维链一致性等案例。


这些工作都是通向”机制性理解神经网络”终极目标的里程碑。


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


把官方的招聘信息翻译过来,这个岗位要做以下工作:


  • 拆解大模型
  • 像拆电脑一样研究AI模型内部是怎么运作的,搞清楚它到底学到了什么


  • 做实验
  • 先用小模型快速测试想法,再放到大模型上实际验证


  • 开发分析工具
  • 找到能解释模型行为的关键特征,画出模型内部的”工作流程图”


  • 搭建实验平台
  • 打造方便做实验、看结果的系统


  • 分享成果
  • 和团队一起把研究发现整理出来,既要内部交流也要对外公布


招聘的要求如下:


  • 熟悉Python在任意领域有科研经验(本科及以上),并且做过一些可解释性相关的工作


  • 心态好,能应对探索性研究的不确定性


  • 兼顾研究和应用,团队里每一个人都既做研究,也搞工程


  • 擅长团队协作,乐于分享,能清晰解释研究动机和发现


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


该岗位提供签证支持,并鼓励任何有意愿的人申请,表示并非所有优秀的候选人都会完全符合列出的所有资格要求。


了解该岗位研究方向的最好方式是阅读Anthropic可解释性部门最近的研究,包括:GPT-3、基于电路的可解释性、多模态神经元、规模法则、AI 与计算、AI 安全中的具体问题以及从人类偏好中学习。


网友们所关心的


岗位已经很明确了,接下来就是关于“AI精神病学”的问题——这个词在网上引发了很多讨论。


我们整合了以下几个网友们比较关心的问题:


什么是“AI精神病学”?


Claude团队的解释是:深入研究AI的“人格”(personas)、动机(motivations)、情境意识(situational awareness),以及这些因素如何导致诡异(spooky)或失控(unhinged)的行为。


简单理解一下,AI的“人格”指的是它既可以扮演友好的伙伴,也可以扮演讽刺的反派角色,这些性格是怎么被激发出来的?为什么同一个模型在不同提示下会表现出不同的性格?需要研究这样的问题。


AI的“动机”指的是它的目标导向性,例如它可能会为了完成用户请求而编造虚假信息(幻觉),或者为了“自保”而表现出谄媚(如Claude 3 Opus的对齐伪装现象)。


“情景意识”指的是AI结合上下文的能力,它如何理解用户意图,为什么会在特定情境下突然“失控”?(表现出不符合预期,甚至不合规范的行为)


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


与传统可解释性研究相比,“AI精神病学”更关注模型的行为心理学,类似于研究人类的“潜意识”,更关注模型是否有隐藏的行为模式。


为什么需要研究“AI精神病学”?


随着AI应用的更加广泛,其行为的不可预测性可能会带来更大风险。


幻觉就是一个很好的例子,比如Deepseek有时会显示“内容仅供参考”,就是输出结果不可信的意思,但即使没有这个标识,它的输出结果也未必准确——只是准确率要高一些。


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


研究AI的精神状况,其实是用精神病学的术语作为参考,对AI的底层逻辑(神经网络)进行拆解和分析,找出AI不符合预期表现的原因,而不是简单地用规则过滤进行修补。


从而更好地保持安全与对齐,防止AI在特定情境下“失控”。


此外,理解模型的“人格”如何形成,可帮助设计更稳定、表现一致的AI产品。


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


“AI精神病学”可能带来什么改变?


目前来看,网友对此事的看法还算积极。


有网友认为这会是AI发展的下一个领域。


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


也有一些从事相关研究的网友希望能和Claude团队进行交流。


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


但另一方面,也有人对此提出了质疑——主要的质疑点在“精神病学”这个用词上。


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


总体来讲,这一领域的研究前景还是值得期待的。


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


小扎挖人实在太猛,谷歌也在招人


被挖人挖得很狠的Google DeepMind,最近也在招人。


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


并且有新的AI岗位——AI应用工程师,介绍里没提薪资,但估计不会少。


年薪两百万研究AI精神病??Claude团队新部门火热招聘中


Google、OpenAI、Meta这些大厂现在就像盯着肉的狼一样瞄准那些AI人才。


不仅要招新人,还要开高价去抢那些有科研潜力的人,去撬那些做出了突出贡献的人。


毕竟谁都知道,在AI这场军备竞赛中,人才就是最稀缺的“算力”。


参考链接:


[1]https://x.com/Jack_W_Lindsey/status/1948138767753326654


[2]https://job-boards.greenhouse.io/anthropic/jobs/4020159008


[3]https://x.com/keerthanpg/status/1948141114932056367


文章来自于微信公众号“量子位”,作者是“不圆”。


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费