摘要
本发明涉及数据处理技术领域,特别是一种低压多源数据校核及清洗方法,其包括搜集和整理来自不同来源的电力用户大数据,建立自动化数据通讯采集与获取机制;使用主成分分析法对数据进行降维,清除噪声数据,简化计算流程;通过处理缺失数据、重复数据和不一致数据,对数据进行清洗;通过对不同来源的数据进行标准化处理,消除单位和量纲的差异;通过对M‑BIRCH算法进行改进,对汇总数据进行初步聚类和低纬度异常校核处理;采用基于人工智能的LSTM改进神经网络对数据进行高维智能化关联校核;使用基于组合统计模型的方法识别坏数据,并提出基于曲线相似度的坏数据修正方法,修正坏数据。本发明的有益效果为能够准确、快速地识别和修正配电网中的坏数据。