摘要
本发明公开了针对预测模型的对抗攻击方法及装置,属于人工智能安全领域。针对网络范围航班延误预测模型实现间接有目标对抗攻击。该方法基于梯度对非目标节点的显著性进行评估,随后使用二分搜索外部循环并嵌套内部循环确定包括第一受害节点子集的初步候选范围,在此基础上进行逐步细化外部循环嵌套内部循环以逼近最小受害节点子集。上述两次循环过程中,对相邻两次外部迭代的第一受害子集和第二第二受害子集的交集进行累积,分别得到第二初始样本和第三初始样本,充分利用扰动信息,最大化受害节点的对抗性潜力,降低攻击所需受害节点数量,有效提升了受害节点子集最小化能力,节省攻击预算。