偏多标签特征选择方法、装置、设备和介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
偏多标签特征选择方法、装置、设备和介质
申请号:CN202411855277
申请日期:2024-12-17
公开号:CN119312070B
公开日期:2025-03-25
类型:发明专利
摘要
本发明提供一种偏多标签特征选择方法、装置、设备和介质,涉及数据预处理技术领域。方法包含S1、获取偏多标签的原始训练数据集,并根据原始训练数据集,初始化标签置信度矩阵,以及构建标签的分布区域。S2、根据近邻的分布,更新标签置信度矩阵,对不可信标签的分布区域进行消歧,以及对不确定标签的分布区域进行迭代更新,直至达到最大迭代次数,获取消歧后的标签。S3、根据消歧后的标签,结合粒度计算与图论,将标签从细粒度聚合到粗粒度,并构造虚拟粗粒度标签。S4、根据虚拟粗粒度标签,结合从样本数据中获取的多个特征,构建适用于偏多标记数据的邻域粗糙集模型,并采用前向贪婪搜索算法选择重要性最高的特征。
技术关键词
特征选择方法 样本 矩阵 邻域粗糙集 搜索算法 Prim算法 生成树 噪声标签 定义标签 特征选择设备 数据预处理技术 特征选择装置 可读存储介质 元素 顶点 定义特征 参数 决策系统