基于自然语言处理的电子病历特征提取方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于自然语言处理的电子病历特征提取方法
申请号:CN202411520697
申请日期:2024-10-29
公开号:CN119361058A
公开日期:2025-01-24
类型:发明专利
摘要
本发明公开了一种基于自然语言处理的电子病历特征提取方法,包括:通过对原始电子病历文本进行清洗、医学术语规范化、中文分词和词性标注,生成预处理后的文本数据;利用微调医学语料的预训练BERT模型进行医疗实体识别,提取医疗实体集合;基于自注意力机制构建关系抽取模型,生成实体关系三元组集合;最终将提取的医疗实体和关系存储到图数据库中,提供API接口供查询和分析,从而有效解决了现有技术中对电子病历非结构化文本信息提取困难的问题。
技术关键词
BERT模型 自然语言 关系抽取模型 电子病历 医疗实体识别 三元组 中文分词 注意力机制 医学术语库 非结构化文本 序列 条件随机场 标签 生成关系