60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了 60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了 关键词: AI高质量评测集,模型训练,Beyond Safe Answers,BSA 让推理模型针对风险指令生成了安全输出,表象下藏着认知危机: 即使生成合规答案,超60%的案例中模型并未真正理解风险。 来自主题: AI技术研报 4826 点击 2025-06-10 11:00