一种融合BERT和BiLSTM的常见病命名实体识别方法
申请号:CN202510891985
申请日期:2025-06-30
公开号:CN120654697A
公开日期:2025-09-16
类型:发明专利
摘要
本发明公开了一种融合BERT和BiLSTM的常见病命名实体识别方法,属于自然语言处理与医疗信息处理技术领域。该方法首先通过BERT预训练模型获取输入文本的动态词向量表示,利用其双向Transformer结构捕捉文本的深层语义特征;然后将BERT输出向量输入BiLSTM网络进行上下文特征增强,通过双向长短期记忆网络提取序列的前后向长距离依赖关系;最后引入CRF层对BiLSTM输出的特征进行标签序列约束,利用转移概率矩阵优化实体边界识别。针对中文医疗文本特点,采用字词结合的方式处理未登录词问题,并构建包含症状、疾病、药品等实体的标注语料库进行模型训练,本方法显著提高了医疗实体边界的识别准确率。
技术关键词
命名实体识别方法
常见病
上下文特征
BERT模型
医疗信息处理技术
标签
双向长短期记忆网络
文本
感知损失函数
序列
医学知识库
转移概率矩阵
双通道结构
维特比算法
动态
搜索全局
维基百科
预训练模型