基于可动态组合多头注意力的电力领域命名实体识别方法
申请号:CN202411961988
申请日期:2024-12-30
公开号:CN119378555A
公开日期:2025-01-28
类型:发明专利
摘要
本发明公开了基于可动态组合多头注意力的电力领域命名实体识别方法,包括如下步骤:构建LERoBERTa‑DCMHA模型,将采集的电力文本字词序列输入模型中,得到电力文本字词序列的字特征向量;根据词典组合与电力文本字词序列,进行电力词汇词向量训练,得到电力文本字词序列的词特征向量;将字特征向量与词特征向量进行特征融合,获得电力文本字词序列的特征向量;对电力文本字词序列的特征向量进行双向特征编码,得到输出状态序列;对输出状态序列进行标注概率排序,获得最终的实体识别结果;本发明通过添加可动态组合多头注意力和卷积池化层TextCNN至预训练语言模型中,提高了模型命名实体识别的性能和准确度。
技术关键词
命名实体识别方法
字词
电力
文本
序列
注意力
归一化模块
训练语言模型
索引
词向量训练
维基百科
前馈神经网络
编码
分词训练
构建词典
动态门控
分词词典