适用于大语言模型的数据处理方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
适用于大语言模型的数据处理方法及装置
申请号:CN202511062993
申请日期:2025-07-30
公开号:CN120893475A
公开日期:2025-11-04
类型:发明专利
摘要
本说明书实施例提供一种适用于大语言模型的数据处理方法及装置,在模型架构上,对代替前馈网络的常规的混合专家模型架构中的各个第一专家网络进行分组,并为得到的各个专家组增设一个第二专家网络。在进行数据处理过程中,第二专家组的激活条件依赖于相应专家组内的第一专家组是否被激活。在相应专家组内的任意第一专家组被激活的情况下,相应的第二专家组被激活。如此,可以为各种业务场景数据提供差异化、自适应的特征数据处理,提高大语言模型各种场景的适应能力。
技术关键词
网络 大语言模型 数据处理方法 处理单元 信息处理 令牌 数据处理装置 文本 计算机 可读存储介质 音频 存储器 处理器 场景 时间段 图像