一种基于特征融合和多任务学习的基因组变异命名实体识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于特征融合和多任务学习的基因组变异命名实体识别方法及系统
申请号:CN202411673471
申请日期:2024-11-21
公开号:CN119623470A
公开日期:2025-03-14
类型:发明专利
摘要
本发明涉及一种基于特征融合和多任务学习的基因组变异命名实体识别方法及系统,包括:获取带有基因组变异实体标注的生物医学文本数据;对生物医学文本数据进行数据增强生成多样化的增强生物医学文本数据;基于增强生物医学文本数据对命名实体识别模型进行训练,通过训练好的命名实体识别模型对待识别生物医学文本进行命名实体识别,得到识别结果;所述命名实体识别模型包括:注意力增强的多尺度特征融合模块、第一BILSTM层、NER模块、token分类模块和实体边界划分模块;本发明解决了数据稀缺问题,同时提出注意力增强的多尺度特征融合模块解决由于实体长度过长、字符特征复杂导致特征表示不准确的问题,提高识别的准确率。
技术关键词
命名实体识别方法 命名实体识别模型 文本 多任务 命名实体识别装置 字符 注意力 命名实体识别系统 序列 同义词 数据获取模块 存储计算机程序 标签类别 存储器 生成随机