摘要
本发明属于深度对抗学习领域,公开了一种基于深度对抗生成的恶意样本检测方法及评测系统,方法包括采用图谱分析技术,对深度网络模型进行图谱分解,得到多个子图谱;在谱域定义对抗谱扰动,并将对抗谱扰动分别添加至各子图谱上,以子图谱频率的易扰动性为指标,测量各子图谱在添加对抗谱扰动前后的输出变化量;对输出变化量大于阈值的子图谱赋予第一加权值,对输出变化量小于或等于阈值的子图谱赋予第二加权值;对重建后的深度网络模型进行离线训练,得到恶意样本检测模型,恶意样本检测模型用于进行恶意样本检测。本发明提供全方位的攻击评测,提升模型检测效果。