摘要
本发明提供一种医学文本中语义结构单元的智能标注方法及系统,涉及数据处理技术领域,该方法包括S1:获取预训练大语言模型,收集含标注信息的医学文本数据并处理成适配格式,经指令微调构建语义结构单元自动识别模型。S2:集成自动识别模型与文本标注工具形成人机交互标注工具,自动标注医学文本数据,网页展示标注信息,组织专家人工校对。S3:收集校对后数据,新数据达预设数量阈值或模型评估指标满足预设条件时,重新训练模型生成新识别模型,并返回执行S2。本发明具有数据驱动、自我进化和人机协同的优点,借助大语言模型降低维护成本,通过自我学习机制增强模型性能,利用人机协同策略解决大模型算法问题并提升标注效率。