摘要
本发明公开了一种工业关键点数据清洗与异常点剔除的方法及相关装置,其中,该方法包括:获取待处理的工业关键点坐标数据,并对坐标数据进行预处理;动态确定预处理后的坐标数据的最优聚类簇数;基于最优聚类簇数,采用第一聚类算法对坐标数据进行聚类,并根据各簇内的距离分布统计特性,识别出第一类异常点;对剔除第一类异常点后的数据,采用基于密度的第二聚类算法进行二次清洗,以识别出被判定为噪声点的第二类异常点;整合第一类异常点和第二类异常点,生成清洗后的数据集。本发明通过将动态聚类、基于簇内统计的异常检测以及密度二次清洗相结合,增强了数据清洗过程的自适应能力、准确性和鲁棒性,能够产出更为纯净、可靠的数据集。