一种基于电商大语言模型的多语言多任务处理方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于电商大语言模型的多语言多任务处理方法
申请号:CN202511049809
申请日期:2025-07-29
公开号:CN120892200A
公开日期:2025-11-04
类型:发明专利
摘要
本发明公开了一种基于电商大语言模型的多语言多任务处理方法,S1:获取多语言购物查询数据集;S2:构建多语言指令数据集;S3:基于多语言购物查询数据集和多语言指令数据集构建初始微调任务数据集;S4:建立数据选择器,通过数据选择器从初始微调任务数据集中筛选得到最终的微调任务数据集;S5:基于最终的微调任务数据集并利用微调方法对通用领域大语言模型进行微调训练,以得到电商大语言模型;S6:基于电商大语言模型实现交易时的多语言多任务处理。本发明建立多任务训练统一框架进行微调训练,使电商大语言模型可以处理多语言、多任务,提高了模型的可扩展性和准确性,在不牺牲推理效率的情况下显著地增强了跨语言的泛化推理能力。
技术关键词
大语言模型 多任务处理方法 数据选择器 多语言 电商 微调方法 指令 代表 样本 种子 聚类算法 列表 平台 关系 矩阵 框架 参数