一种基于PABA自适应触发器的干净标签后门攻击方法及装置
申请号:CN202510689839
申请日期:2025-05-27
公开号:CN120597267A
公开日期:2025-09-05
类型:发明专利
摘要
本发明涉及生成式人工智能,提供了一种基于PABA自适应触发器的干净标签后门攻击方法及装置。目的在于通过生成自适应触发器的对抗博弈训练方法,实现高效隐蔽的干净标签后门攻击,主要方案包括S10:构建触发器生成器、判别器和代理模型,收集与目标标签数据相关的代理数据集;S20:将本地目标标签数据与代理数据集合成聚合数据集,训练判别器区分中毒数据与干净数据;S30:使用触发器生成器对本地目标标签数据进行中毒处理,结合聚合数据集训练代理模型;S40:通过联合判别器的二分类损失和代理模型的交叉熵损失,对抗式优化触发器生成器;S50:循环执行步骤S20‑S40直至各模块收敛,生成可迁移至受害者模型的自适应触发器。
技术关键词
标签
神经网络架构
分类准确率
卷积神经网络结构
网络爬虫技术
梯度下降算法
后门
模块
数据中心
参数
标记
语义
样本
误差
动态
图像
强度