数据处理方法、生成方法及大语言模型训练系统

申请号：CN202411815386

申请日期：2024-12-10

公开号：CN119988534A

公开日期：2025-05-13

类型：发明专利

摘要

本说明书实施例提供数据处理方法、生成方法及大语言模型训练系统，所述数据处理方法包括：将问答任务对应的问题数据输入至大语言模型，大语言模型包含基础专家模块、专家路由模块和领域专家模块。通过基础专家模块预测问题数据获得基础答案数据，利用较为通用的专家模型将问题数据作为一般任务进行预测。利用专家路由模块在领域专家模块中选择匹配问答任务的目标专家子模块，将问题数据和作为目标专家子模块参考数据的基础答案数据输入目标专家子模块进行处理，获得问答任务对应的答案数据，目标专家子模块可以将基础答案数据作为参考，结合专家模块具备的特定领域数据预测能力对问题数据进行预测，提高答案数据的准确性。

技术关键词

大语言模型数据处理方法子模块基础答案语言模型训练系统基座生成方法服务端客户端指令处理器数据处理系统存储计算机程序计算机程序产品矩阵可读存储介质