摘要
本发明提供的一种大语言模型的调整优化方法包括:基于第一大语言模型根据问题输入所输出的答案收集用户反馈数据;对用户反馈数据进行数据的清洗和预处理并进行反馈特征提取,采用强化学习的方法优化第一大语言模型的答案生成策略得到第二大语言模型;应用第二大语言模型根据问题输入进行类型识别并转化为结构化查询语句,根据结构化查询语句进行查询扩展,根据扩展出的查询语句生成答案,生成的答案中包含解释性文本。应用该方法能够将用户反馈数据融入模型的训练过程中进行答案生成策略的优化;能够提供模型的输出依据和逻辑提升用户对模型输出的信任度以及促进模型决策过程的透明度,实现提升大型语言模型的用户个性化需求适应性和输出可靠性。