一种医学文本中语义结构单元的智能标注方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种医学文本中语义结构单元的智能标注方法及系统
申请号:CN202510273222
申请日期:2025-03-10
公开号:CN119783681A
公开日期:2025-04-08
类型:发明专利
摘要
本发明提供一种医学文本中语义结构单元的智能标注方法及系统,涉及数据处理技术领域,该方法包括S1:获取预训练大语言模型,收集含标注信息的医学文本数据并处理成适配格式,经指令微调构建语义结构单元自动识别模型。S2:集成自动识别模型与文本标注工具形成人机交互标注工具,自动标注医学文本数据,网页展示标注信息,组织专家人工校对。S3:收集校对后数据,新数据达预设数量阈值或模型评估指标满足预设条件时,重新训练模型生成新识别模型,并返回执行S2。本发明具有数据驱动、自我进化和人机协同的优点,借助大语言模型降低维护成本,通过自我学习机制增强模型性能,利用人机协同策略解决大模型算法问题并提升标注效率。
技术关键词
结构单元 智能标注方法 语义 标注工具 文本 大语言模型 医学 计算机软件产品 计算机存储介质 人机协同 总线系统 执行存储器存储 指令 格式 标注系统 微调方法 数据处理技术 模型算法 指标