Anthropic公布新技术:不靠删数据,参数隔离移除AI危险 Anthropic公布新技术:不靠删数据,参数隔离移除AI危险 关键词: AI新闻,模型训练,AI安全,SGTM,Anthropic 近年来,大语言模型的能力突飞猛进,但随之而来的却是愈发棘手的双重用途风险(dual-use risks)。当模型在海量公开互联网数据中学习时,它不仅掌握语言与推理能力,也不可避免地接触到 CBRN(化学、生物、放射、核)危险制造、软件漏洞利用等高敏感度、潜在危险的知识领域。 来自主题: AI技术研报 8298 点击 2025-12-25 10:21