适用于大语言模型的数据处理方法及装置

申请号：CN202511062993

申请日期：2025-07-30

公开号：CN120893475A

公开日期：2025-11-04

类型：发明专利

摘要

本说明书实施例提供一种适用于大语言模型的数据处理方法及装置，在模型架构上，对代替前馈网络的常规的混合专家模型架构中的各个第一专家网络进行分组，并为得到的各个专家组增设一个第二专家网络。在进行数据处理过程中，第二专家组的激活条件依赖于相应专家组内的第一专家组是否被激活。在相应专家组内的任意第一专家组被激活的情况下，相应的第二专家组被激活。如此，可以为各种业务场景数据提供差异化、自适应的特征数据处理，提高大语言模型各种场景的适应能力。

技术关键词

网络大语言模型数据处理方法处理单元信息处理令牌数据处理装置文本计算机可读存储介质音频存储器处理器场景时间段图像