无数据场景下深度神经网络模型后门检测方法及相关设备
申请号:CN202510700713
申请日期:2025-05-28
公开号:CN120541580A
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开了一种无数据场景下深度神经网络模型后门检测方法及相关设备,选择待测深度神经网络模型的最后一层线性层作为检测层;构造具有不同类别标签的初始潜在表示向量,并将初始潜在表示向量输入检测层;其中,不同类别标签为待测深度神经网络模型的各输出类别标签;优化初始潜在表示向量,得到不同类别标签下初始潜在表示向量的收敛轮数;基于不同类别标签下初始潜在表示向量的收敛轮数,构造异常度量;基于自适应阈值和异常度量,确定待测深度神经网络模型是否存在后门,并确定后门类型、目标类别以及来源类别。本发明只需要深度神经网络模型最后一层的线性层即可检测复杂的后门攻击,能够识别目标类别、后门类型,以及特定类后门攻击的来源类别。
技术关键词
深度神经网络模型
后门检测方法
标签
度量
场景
计算机程序产品
序列
数据
处理器
可读存储介质
线性
计算机设备
输入模块
存储器
数值