过采样多聚类融合的数据预测方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
过采样多聚类融合的数据预测方法、装置、设备及介质
申请号:CN202510142384
申请日期:2025-02-10
公开号:CN119598231A
公开日期:2025-03-11
类型:发明专利
摘要
本发明提供的过采样多聚类融合的数据预测方法、装置、设备及介质,涉及数据预测领域。本发明通过获取原始数据集,进行预处理后,分为少数类数据和多数类数据;对少数类数据分别采用不同的聚类算法进行聚类,并将生成的聚类中心数据添加到少数类数据中;对添加聚类中心后的少数类数据进行IF‑SNNDPC聚类,并计算每个子簇的过采样数量;在每个子簇中,计算随机选择的两个非聚类中心的点与聚类中心之间的质心,并将质心作为新样本加入少数类数据中,直至满足对应子簇所需的样本数量,得到最终的少数类数据;将最终的少数类数据与多数类数据一起输入预先训练好的XGBoost模型,得到预测的数据。本发明能增加少数类别的样本数量,解决样本数据类别不平衡的问题。
技术关键词
数据预测方法 样本 计算机可读指令 算法 成绩 聚类 邻居 数据预测装置 可读存储介质 交叉验证法 学生 度量 密度 处理器 存储器 训练集 表达式