一种基于孤立森林算法的交通行业数据质量异常检测方法
申请号:CN202410911320
申请日期:2024-07-09
公开号:CN119049266A
公开日期:2024-11-29
类型:发明专利
摘要
本发明涉及一种基于孤立森林算法的交通行业数据质量异常检测方法,具体涉及交通工程领域,通过交通行业信息系统和交通行业专用终端设备分别自动捕捉静态、动态交通数据,减少人工干预并提高数据采集的效率和准确性,检查并处理交通行业数据集,根据交通行业数据集中字段取值范围判断字段类型,利用One‑Hot Encoding方法对离散型字段进行独热编码处理,通过迭代构造孤立子树组合构成孤立森林,并识别交通行业数据集的异常点,对当前静态、动态交通数据对应的异常点所在的特征进行绘制箱线图并可视化,连接领域知识图谱并结合特征和上下文信息探索导致当前静态、动态交通数据异常的原因,提高异常检测的效果和准确性,更全面地评估数据的异常性。
技术关键词
动态交通数据
孤立森林算法
异常检测方法
异常点
行业专用
静态交通
信息系统
字段
节点
终端设备
构建知识图谱
实体
编码
分支
定义
关系