摘要
本发明公开了一种适用于大数据分析的数据预处理方法及系统,涉及数据预处理技术领域。包括通过大数据收集原始数据;使用动态相关性补充方法计算补充值,对数据的缺失特征值进行补充,对缺失特征值的补充更加符合数据的整体趋势,提高补充值准确性;通过可靠性常数计算方法获取不同来源的可靠性常数,对不同来源的数据进行不同比例的抽取;将数据进行合并、统一和归一化处理。本发明通过动态相关性补充方法计算补充值,对数据的缺失特征值进行补充,根据数据的其他特征值与缺失特征值的相关性,确定其他特征值对缺失特征值的相关权重,相关性呈动态变化,对缺失特征值的补充更加符合数据的整体趋势,提高补充值准确性。