摘要
本发明公开了一种基于隐空间分布约束的对抗图像净化方法、设备及介质,其中方法包括:生成对抗样本;从预训练的一致性生成模型的隐空间中采样若干初始点生成图像,作为生成样本;将对抗样本作为参照样本,使用梯度下降方法更新隐空间采样点,通过多轮生成来最小化生成样本与参照样本间的差异;在优化过程中约束隐空间采样点的分布,抑制生成样本对攻击扰动的模仿,以实现对输入样本净化;根据所得多个净化样本的预测进行投票,得到预测结果。本发明提出的对抗图像净化框架主要解决对抗净化中消除攻击扰动残留与恢复样本细节内容难兼顾的问题,结合对隐空间采样点的分布约束,可以实现对抗样本的有效净化,确保神经网络模型的安全性和鲁棒性。