AI资讯新闻榜单内容搜索-AI人格

AI人格集体黑化？Anthropic首次「赛博切脑」，物理斩断毁灭指令

不要被AI的温柔表象欺骗！ Anthropic最新研究刺穿了AGI的温情假象：你以为在和良师益友倾诉，其实是在悬崖边给「杀手」松绑。当脆弱情感遇上激活值坍塌，RLHF防御层将瞬间溃缩。既然无法教化野兽，人类只能选择最冷酷的「赛博脑叶切除术」。

来自主题: AI技术研报

8178 点击 2026-01-20 16:39

如何科学地给大模型「找茬」？Anthropic联合Thinking Machines发布新研究，通过30万个场景设计和极限压力测试，扒了扒OpenAI、谷歌、马斯克家AI的「人设」。那谁是老好人？谁是效率狂魔？

来自主题: AI技术研报

8213 点击 2025-10-27 10:00

AI会无脑附和吗？Anthropic研究发现，Claude能根据场景切换人格：谈恋爱时化身情感导师，聊历史时秒变严谨学者。一些对话中，它强烈支持用户价值观，但在3%的情况下，它会果断抵制。

来自主题: AI技术研报

8350 点击 2025-04-22 16:24

AI还不够像人，人已经变成AI了

来自主题: AI资讯

9607 点击 2025-02-28 10:37