基于随访大模型的数据合成方法与装置

申请号：CN202510734501

申请日期：2025-06-04

公开号：CN120260961A

公开日期：2025-07-04

类型：发明专利

摘要

本发明涉及基于随访大模型的数据合成方法与装置，该方法包括：获取待随访的疾病数据集合，将疾病数据集合划分为不同背景的随访患者。基于不同背景的随访患者及各随访患者对应的疾病数据、背景信息和随访场景，调用训练后的随访大模型合成随访对话。通过规则匹配和随访大模型对随访对话进行过滤，过滤出不符合预设标准的随访对话，保留符合预设标准的随访对话。对符合预设标准的随访对话进行融合与预处理，得到合成数据，并通过开源的微调框架LLaMA Factory基于合成数据对随访大模型进行微调。随访大模型为Qwen2.5‑14B模型基于疾病数据集合中的疾病数据、随访患者的背景信息以及随访场景进行SFT微调训练得到的。

技术关键词

数据疾病患者场景语义框架计算机存储介质过滤模块医学处理器存储器电子设备