基于自然语言处理的电子病历特征提取方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
基于自然语言处理的电子病历特征提取方法
申请号:
CN202411520697
申请日期:
2024-10-29
公开号:
CN119361058A
公开日期:
2025-01-24
类型:
发明专利
摘要
本发明公开了一种基于自然语言处理的电子病历特征提取方法,包括:通过对原始电子病历文本进行清洗、医学术语规范化、中文分词和词性标注,生成预处理后的文本数据;利用微调医学语料的预训练BERT模型进行医疗实体识别,提取医疗实体集合;基于自注意力机制构建关系抽取模型,生成实体关系三元组集合;最终将提取的医疗实体和关系存储到图数据库中,提供API接口供查询和分析,从而有效解决了现有技术中对电子病历非结构化文本信息提取困难的问题。
技术关键词
BERT模型
自然语言
关系抽取模型
电子病历
医疗实体识别
三元组
中文分词
注意力机制
医学术语库
非结构化文本
序列
条件随机场
标签
生成关系