网络攻击识别模型的训练数据生成方法及装置、电子设备
申请号:CN202510685062
申请日期:2025-05-26
公开号:CN120474791A
公开日期:2025-08-12
类型:发明专利
摘要
本发明公开了一种网络攻击识别模型的训练数据生成方法及装置、电子设备,涉及网络安全领域,其中,该方法包括:从多个信息源收集待识别邮件,对预处理后的待识别邮件进行分类处理和标注处理,得到标注邮件样本集,提取内容特征、发件人特征、结构特征和附件特征,得到样本特征集合,利用生成对抗网络模型进行数据合成,生成合成邮件样本,将标注邮件样本以及合成邮件样本转换为预设模型数据格式,生成模型训练数据集,对预设大语言模型进行训练,通过模型识别往来邮件是否为钓鱼邮件。本发明解决了相关技术中识别钓鱼邮件的模型未能及时更新识别攻击方式的训练数据,容易造成邮件过滤出现疏漏,影响用户满意度的技术问题。
技术关键词
训练数据生成方法
钓鱼邮件
大语言模型
网络攻击识别
样本
附件特征
生成对抗网络模型
邮件正文
统一资源定位
数据格式
网络安全服务器
路径结构
文本
监督学习算法
数据生成装置
邮件网关
邮件服务器
特征提取单元