摘要
本申请公开了一种针对海量地下水监测数据的整编方法及装置,涉及数据处理领域,方法包括获取待整编地下水监测数据,并进行数据清洗和噪声处理,得出去噪后的监测数据;采用局部异常因子算法、TukeyBoxplot算法、STL时间序列分解算法和孤立森林对去噪后的监测数据进行深度分析,确定异常数据;获取异常数据的人工判别结果;剔除人工判别结果中的异常数据,得出整编后的地下水监测数据。本发明先用机器学习的方式进行数据异常的识别,之后对标记的异常数据由人工进一步识别判断,使用了机器学习和人工识别相结合的手段,对海量监测数据进行多轮次的异常处理,提高大批量数据整编的效率,保证了整编后数据的质量。