摘要
本发明属于异常数据清洗领域,公开了一种基于多模型融合的异常数据清洗方法及系统,该异常数据清洗方法包括以下步骤:对待清洗数据进行预处理;识别离散异常数据;识别堆积异常数据;建立随机森林模型和长短期神经网络模型;基于人工鱼群算法将随机森林模型和长短期神经网络模型组合,得到RF‑LSTM预测模型;将含缺值数据输入RF‑LSTM预测模型,输出预测结果填充至数据集,完成异常数据清洗,结合孤立森林算法和聚类算法,能够有效地识别出具有离散分布和聚集分布的异常数据,拓宽了异常数据识别的范围,提高了识别的准确性和全面性,利用RF‑LSTM预测模型对缺失值进行预测和填充,可以确保数据集的完整性和一致性,从而进一步提高业务决策的准确性。