一种应用于不平衡数据的自适应集成学习分类方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种应用于不平衡数据的自适应集成学习分类方法
申请号:CN202411551532
申请日期:2024-11-01
公开号:CN119202949A
公开日期:2024-12-27
类型:发明专利
摘要
本发明提出一种应用于不平衡数据的自适应集成学习分类方法,包括以下步骤:对原始数据进行预处理并提取负类数据和正类数据;然后分别划分为训练集、验证集和测试集;利用滑动窗口对正类和负类的训练集提取特征;对其中的负类聚类后对样本随机欠采样;将欠采样后的样本和相同特征子集下的正类训练集样本组合;选择随机森林为基分类器并利用组合的训练集进行训练;利用正类和负类的验证集组合计算基分类器的交叉熵损失并为每一个基分类器分配权重;利用正类和负类测试集组合进行加权投票,得到预测标签以进行指标计算。本发明结合特征子集的多样性提取和聚类欠采样技术,在面对不平衡数据集的分类问题时能提高对少数类样本的识别能力,优化分类性能。
技术关键词
集成学习分类方法 滑动窗口 训练集 数据 标签 样本 随机森林 分类器训练 采样技术 索引 特征数 指标 两阶段 算法 基础 格式 策略 标记
系统为您推荐了相关专利信息
工作流 标识 指令 数据 客户端
处理单元 读写控制模块 时序 网络设备 存储器
链路 混合整数线性规划 网络拓扑信息 卫星网络拓扑 识别方法
分类识别模型 图像 预测特征 特征融合网络 像素点
动态部署方法 安全控制模块 动态部署系统 节点 构建状态转移模型