勘察设计企业资产多元异构数据融合与知识图谱构建方法
申请号:CN202411559531
申请日期:2024-11-04
公开号:CN119474403A
公开日期:2025-02-18
类型:发明专利
摘要
本发明公开了一种勘察设计企业资产多元异构数据融合与知识图谱构建方法,包括采集企业资产数据信息,包括结构化数据和非结构化数据;针对结构化数据进行去除无效及缺失值处理,同时将清洗后的数值数据转换为文本格式;针对非结构化数据,和文本格式后的结构化数据进行文本数据规范化处理与优化,文本消歧规范化同时构建词向量;利用解码器BERT模型分别抽取结构化数据和非结构化数据的特征;利用Lite Transformer融合各类数据特征构建知识图谱;解决了现有勘察设计企业数据规模庞大,数据质量参差不齐,无法快速从历史数据中得到相应设计历史及已经收集的现场相关信息的情况,使得前期勘察数据重复,后期设计不一致等问题。
技术关键词
知识图谱构建方法
多元异构数据
抽取结构化数据
构建知识图谱
BERT模型
资产
文本
命名实体识别
企业
创建知识图谱
解码器
大规模语料库
数据预处理方法
分词
训练算法
模式匹配
注意力机制
特征值