一种基于PABA自适应触发器的干净标签后门攻击方法及装置

申请号：CN202510689839

申请日期：2025-05-27

公开号：CN120597267A

公开日期：2025-09-05

类型：发明专利

摘要

本发明涉及生成式人工智能，提供了一种基于PABA自适应触发器的干净标签后门攻击方法及装置。目的在于通过生成自适应触发器的对抗博弈训练方法，实现高效隐蔽的干净标签后门攻击，主要方案包括S10：构建触发器生成器、判别器和代理模型，收集与目标标签数据相关的代理数据集；S20：将本地目标标签数据与代理数据集合成聚合数据集，训练判别器区分中毒数据与干净数据；S30：使用触发器生成器对本地目标标签数据进行中毒处理，结合聚合数据集训练代理模型；S40：通过联合判别器的二分类损失和代理模型的交叉熵损失，对抗式优化触发器生成器；S50：循环执行步骤S20‑S40直至各模块收敛，生成可迁移至受害者模型的自适应触发器。

技术关键词

标签神经网络架构分类准确率卷积神经网络结构网络爬虫技术梯度下降算法后门模块数据中心参数标记语义样本误差动态图像强度

系统为您推荐了相关专利信息

基于多模态时序特征的癌症复发概率深度学习预测系统

深度学习预测时序特征多模态 LSTM模型复发预测模型

基于大语言模型的纪念场馆私有化知识库系统及其抗幻觉约束方法

知识库系统大语言模型数据处理引擎约束方法场馆

一种可逆人脸匿名化模型的训练方法、可逆人脸匿名化方法及相关产品

密码匿名化方法人脸身份加权损失函数高斯混合模型

工程造价预测方法、装置、电子设备和存储介质

工程造价预测方法碰撞模型因子样本多模态

一种跨语言代码程序分类、分类模型训练方法及装置

分类模型训练方法抽象语法树程序分类方法节点标签