数据清洗方法、装置、设备、介质及产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
数据清洗方法、装置、设备、介质及产品
申请号:CN202411863185
申请日期:2024-12-17
公开号:CN119719089A
公开日期:2025-03-28
类型:发明专利
摘要
本申请提供一种数据清洗方法、装置、设备、介质及产品,涉及大数据领域。包括:获取待清洗数据;根据预设的增强学习模型,确定数据清洗规则,其中,预设的增强学习模型的状态空间为当前数据的质量特性,预设的增强学习模型的动作空间为清洗操作,预设的增强学习模型的奖励函数为基于清洗效果的提升度量,每个清洗操作包括对应的至少一个数据清洗规则;根据数据清洗规则,对待清洗数据进行数据清洗处理,以得到清洗后数据;根据清洗后数据和待清洗数据,确定待清洗数据的清洗效果;根据待清洗数据的清洗效果,优化预设的增强学习模型。本申请的方法,提升了数据清洗灵活性和数据清洗效果。
技术关键词
清洗规则 计算机执行指令 数据清洗方法 数据清洗设备 数据清洗装置 企业内部数据 度量 异常数据 度计算方法 可读存储介质 计算机程序产品 统计方法 聚类算法 处理器通信 存储器 模块 格式化 大数据