基于集成学习的重复数据删除效率优化方法及相关装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于集成学习的重复数据删除效率优化方法及相关装置
申请号:CN202510236491
申请日期:2025-02-28
公开号:CN120196602A
公开日期:2025-06-24
类型:发明专利
摘要
本发明公开了一种基于集成学习的重复数据删除效率优化方法及相关装置,包括:构建增强可扩展性的二进制分类器;对所述增强可扩展性的二进制分类器进行训练,得到训练后的增强可扩展性的二进制分类器;获取待分类的数据集,将所述待分类的数据集输入到训练后的增强可扩展性的二进制分类器中,根据增强可扩展性的二进制分类器的分类结果删除重复数据,该方法及相关装置能够删除重复数据,且去重效率和效能较为优异。
技术关键词
效率优化方法 分类器 算法模块 效率优化系统 数据 多核极限学习机 输出模块 可读存储介质 处理器 随机森林 计算机设备 指纹 存储器 子模块 效能 标签 机制 关系