针对电力作业文本的知识图谱构建方法、装置、介质及芯片
申请号:CN202410926138
申请日期:2024-07-11
公开号:CN118469006B
公开日期:2024-09-24
类型:发明专利
摘要
一种针对电力作业文本的知识图谱构建方法、装置、介质及芯片,克服了现有技术中知识量少、识别率低、资源占用高的缺陷。该方法涵盖本体层定义、实体关系抽取、实体消歧、图谱构建等关键环节。通过预处理电力文本语料、构建词向量表、实体类型标注、LEBERT‑BiGRU‑CRF模型训练、关系标注、实体关系联合抽取及知识融合消歧等步骤,实现从文本中抽取实体及关系,并构建成可视化的电力作业知识图谱。引入了词汇增强和注意力机制,提升识别准确率,采用先实体识别后联合抽取的模式,有效解决实体重叠问题,优化知识抽取效果。将抽取的实体关系三元组导入图数据库,形成电力作业领域的知识库,为一种高效、精准的知识图谱构建方法。
技术关键词
知识图谱构建方法
实体关系数据
电力
文本
三元组
字符
词语
CRF模型
命名实体识别模型
语句
实体关系抽取
多头注意力机制
计算机
标签