一种融合生成式大模型的模型汇聚方法、系统及相关装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种融合生成式大模型的模型汇聚方法、系统及相关装置
申请号:CN202510104047
申请日期:2025-01-23
公开号:CN119538197B
公开日期:2025-04-25
类型:发明专利
摘要
本申请公开了一种融合生成式大模型的模型汇聚方法、系统及相关装置,用于提高模型的性能。本申请包括:收集多模态特征向量的数据集,并使用数据集训练子模型,基于子模型和多模态特征向量构建初始生成式大模型;将初始生成式大模型划分为多个层级,每个层级包括多个子层;基于子层的类型计算每个子层的复杂值;获取子层的可训练参数占用内存和中间结果占用内存,并计算得到内存占用值;获取子层的增益影响和生成指标提升值,并计算得到贡献值;获取复杂值、内存占用值以及贡献值的预设权重,计算得到影响值;判断影响值是否超过剪枝阈值;若否,则对未超过剪枝阈值的子层进行剪枝,得到目标子层;将目标子层进行汇聚,得到目标生成式大模型。
技术关键词
内存 汇聚方法 输入输出单元 多模态 层级 傅里叶变换算法 归一化算法 功能模块 汇聚系统 汇聚装置 参数 基础 可读存储介质 指标 矩阵 复杂度 通道 存储器 程序 计算机