摘要
本发明公开了一种基于电商大语言模型的多语言多任务处理方法,S1:获取多语言购物查询数据集;S2:构建多语言指令数据集;S3:基于多语言购物查询数据集和多语言指令数据集构建初始微调任务数据集;S4:建立数据选择器,通过数据选择器从初始微调任务数据集中筛选得到最终的微调任务数据集;S5:基于最终的微调任务数据集并利用微调方法对通用领域大语言模型进行微调训练,以得到电商大语言模型;S6:基于电商大语言模型实现交易时的多语言多任务处理。本发明建立多任务训练统一框架进行微调训练,使电商大语言模型可以处理多语言、多任务,提高了模型的可扩展性和准确性,在不牺牲推理效率的情况下显著地增强了跨语言的泛化推理能力。