摘要
本发明请求保护一种基于低频特征分布的触发器生成模型后门攻击方法,属于计算机视觉与深度学习安全领域。包括下列主要步骤:S1,攻击者利用频域触发器生成模型来毒害干净样本,得到引入后门特征的对抗样本;S2,用含有对抗样本的毒化数据集训练模型,通过映射对抗样本和目标标签的方式将后门注入到受害模型;S3,将S2中得到的受害模型进行推理,并利用后门攻击性能判断指标进行攻击效果衡量。本发明方法与现有的方法相比,具有以下主要优点:(1)利用频域触发器,提高对抗样本中触发器的隐蔽性。(2)该对抗样本与原样本内容具有相关性,因此该样本在具有较高的攻击有效性的同时,也对不同主流后门防御具有更强的鲁棒性。