一种融合生成式大模型的模型汇聚方法、系统及相关装置
申请号:CN202510104047
申请日期:2025-01-23
公开号:CN119538197B
公开日期:2025-04-25
类型:发明专利
摘要
本申请公开了一种融合生成式大模型的模型汇聚方法、系统及相关装置,用于提高模型的性能。本申请包括:收集多模态特征向量的数据集,并使用数据集训练子模型,基于子模型和多模态特征向量构建初始生成式大模型;将初始生成式大模型划分为多个层级,每个层级包括多个子层;基于子层的类型计算每个子层的复杂值;获取子层的可训练参数占用内存和中间结果占用内存,并计算得到内存占用值;获取子层的增益影响和生成指标提升值,并计算得到贡献值;获取复杂值、内存占用值以及贡献值的预设权重,计算得到影响值;判断影响值是否超过剪枝阈值;若否,则对未超过剪枝阈值的子层进行剪枝,得到目标子层;将目标子层进行汇聚,得到目标生成式大模型。
技术关键词
内存
汇聚方法
输入输出单元
多模态
层级
傅里叶变换算法
归一化算法
功能模块
汇聚系统
汇聚装置
参数
基础
可读存储介质
指标
矩阵
复杂度
通道
存储器
程序
计算机