摘要
一种基于样本语义差异的图像对抗样本检测方法,涉及网络安全技术领域,包括以下步骤:训练条件生成模型,对原始样本进行分类并重构,生成与原始样本对应的重构样本,将原始样本和重构样本作为正样本对,其余样本组合作为负样本对,通过对比学习训练语义提取器,结合语义提取器提取原始样本和重构样本的语义特征并计算语义特征的相似度特征值,将相似度特征值作为输入特征,训练隔离森林模型,之后将待测样本重构后按照同样方法提取语义特征的相似度特征值,代入隔离森林模型检测得到待测样本中的对抗样本;本发明的对抗样本检测方法,可依据标签生成图像,不依赖目标分类器的网络结构和中间层输出,能够有效适用于黑盒场景,显著扩大其适用范围。