一种基于无标签数据的概念漂移自适应方法、系统及终端
申请号:CN202510106895
申请日期:2025-01-23
公开号:CN120030349A
公开日期:2025-05-23
类型:发明专利
摘要
本发明公开了一种基于无标签数据的概念漂移自适应方法、系统及终端,所述方法包括:利用KL距离判断新数据是否发生概念漂移;当判定新数据发生概念漂移时,基于原随机森林模型,结合基尼系数、权重和密度差建立建树新准则,得到RFKL模型;基于新训练集,选择建树新准则的最小值对应的特征为分裂特征,利用分裂特征训练RFKL模型,得到训练好的RFKL模型;使用准确率作为评价指标评估训练好的RFKL模型的性能,将性能满足要求的训练好的RFKL模型作为概念漂移自适应后的RFKL模型。本发明直接使用无标签的新数据更新模型,实现基于无标签数据的概念漂移的自适应,省时省力。
技术关键词
无标签数据
随机森林模型
概念
训练集数据
密度
数据收集模块
样本
构建决策树
模型训练模块
可读存储介质
指标
节点
处理器
终端
数据更新
程序
省时省力