摘要
本发明提供一种眼科语言大模型的构建方法,包括:S1、获取多个眼科领域原始数据集;S2、采用预先配置的第一语言大模型筛选出与眼科相关的数据;S3、采用第一语言大模型对筛选出的的数据进行清洗以及标准化处理,以标准化为{提示词、用户问题、问题回答}结构的数据样本;S4、收集眼科专业知识并基于此构建眼科专业医学教材片段,采用第一大语言模型根据眼科专业医学教材片段生成与片段内容相关的眼科问答数据;S5、采用第一大语言模型根据步骤S4中的数据生产多组语义等价但表达方式不同的新数据,并将新数据统一标准化;S6、获取的数据样本组成训练集,以提示词和用户问题为输入,问题回答为标签,对基座大语言模型进行有监督训练。