摘要
本发明涉及基于随访大模型的数据合成方法与装置,该方法包括:获取待随访的疾病数据集合,将疾病数据集合划分为不同背景的随访患者。基于不同背景的随访患者及各随访患者对应的疾病数据、背景信息和随访场景,调用训练后的随访大模型合成随访对话。通过规则匹配和随访大模型对随访对话进行过滤,过滤出不符合预设标准的随访对话,保留符合预设标准的随访对话。对符合预设标准的随访对话进行融合与预处理,得到合成数据,并通过开源的微调框架LLaMA Factory基于合成数据对随访大模型进行微调。随访大模型为Qwen2.5‑14B模型基于疾病数据集合中的疾病数据、随访患者的背景信息以及随访场景进行SFT微调训练得到的。