一种大数据中基于仿射特征融合的小样本嵌套命名实体识别方法
申请号:CN202510706683
申请日期:2025-05-29
公开号:CN120611716A
公开日期:2025-09-09
类型:发明专利
摘要
本发明属于自然语言处理技术领域,具体涉及一种大数据中基于仿射特征融合的小样本嵌套命名实体识别方法;包括:嵌套命名实体识别模型包括放射特征融合模块和候选跨度分类模块;采用预训练的BERT模型和BiLSTM网络依次对文本进行两次编码,采用放射特征融合模块对编码结果进行处理,得到候选跨度和分词的全局语义融合特征;根据候选跨度和真实标签计算二元交叉熵损失并调整放射特征融合模块参数,得到训练好的放射特征融合模块;采用候选跨度分类模块对候选跨度和分词的全局语义融合特征进行处理,得到嵌套命名实体识别结果并计算最终损失,根据最终损失调整候选跨度分类模块,得到训练好的候选跨度分类模块;本发明在大数据处理领域自然语言处理中的嵌套命名实体识别任务上性能更好。
技术关键词
跨度
融合特征
命名实体识别模型
大数据
自然语言
样本
标签类别
语义
分词
原型
嵌套
模块
预训练语言模型
矩阵
词嵌入向量
关系
文本