摘要
本发明属于网络安全技术领域,具体提供一种基于迁移学习的稀疏标签网络流量分类方法,包括如下步骤:步骤S1:获取网络流量样本数据集;步骤S2:对数据集进行四个步骤的预处理,得到优化后数据集,步骤S3:将优化后数据集中的目标域数据按照8:2的比例划分训练集和测试集,并且设置训练集只有5%的样本数据带有标签,然后将优化后目标域训练集和优化后源域数据合并输入到改进的权重加权模型Tradaboost,得到加权数据集;步骤S4:将加权数据集中的源域数据和优化后数据集中的目标域训练集数据一同输入到改进的DANN模型进行对抗训练;步骤S5:输出分类结果。有效解决了目前主流的流量分类方法无法有效应对流量标签稀缺的问题。