摘要
本发明涉及人工智能与网络数据分析交叉技术领域,特别涉及一种网络数据概念漂移自监督检测分类方法及系统,从数据流中获取无标签的网络数据,并通过混合数据增强策略构建正样本对;使用双分支融合混合专家模型的Vision Transformer特征提取网络对正样本对、负样本对进行特征提取,并通过InfoNCE损失函数优化模型;在下游任务阶段,在预训练完成的融合混合专家模型的Vision Transformer特征提取网络的基础上并行添加分类分支和置信度分支,分别输出类别预测概率和置信度;利用验证集中分类正确和分类错误的样本,结合网格搜索法计算置信度阈值;根据置信度阈值判定样本数据是否发生概念漂移。本发明在少标签场景下显著提升网络数据概念漂移的检测分类性能。