摘要
本发明公开了一种基于机器学习的加工数据质量监测系统及方法,涉及数据分析技术领域,本方法包括以下步骤:获取多源加工数据并按照时间进行排序,对每个数据值进行空值和合理性检测并进行相应标记;使用孤立森林算法分析数据向量,输出全局异常得分并分解为局部得分,标记为机器学习异常;根据异常标记情况选择随机森林回归模型或LSTM模型预测替换值;对替换值进行范围校验,根据异常类型决定是否进行替换或提交人工审核;计算加工数据值和替换值的残差,用GMM拟合高斯分量并赋予语义,根据簇语义和隶属度定义处理方式。本方法能够有效改善现有技术中存在的异常数据可能误判以及修正后的数据仍可能异常的情况。