提升大模型内在透明度:无需外部模块实现高效监控与自发安全增强|上海AI Lab & 上交 提升大模型内在透明度:无需外部模块实现高效监控与自发安全增强|上海AI Lab & 上交 关键词: AI,模型训练,TELLME,人工智能 大语言模型(LLM)能力提升引发对潜在风险的担忧,洞察其内部“思维过程”、识别危险信号成AI安全核心挑战。 来自主题: AI技术研报 7191 点击 2025-06-23 14:58