摘要
本发明涉及数据处理技术领域,公开了一种多源信息融合的异构数据规则化方法,包括:在污水处理过程若干个处理阶段布设分布式传感器,通过接入协议与时序同步采集所有分布式传感器的检测数据;对检测数据进行语义解析,将检测数据进行标签归一并完成语义标签标准化;对语义标准化后的检测数据进行处理,获得元数据;构建基于迁移学习的数据跨层表征模型,并对元数据进行特征提取与语义嵌入,获得统一的向量化表达;根据向量化表达构建面向污水处理全流程的信息知识图谱。本申请实现对不同数据源间时序、语义与结构特征的统一向量化表达,提升了数据的可融合性、可解释性和可用性。