大语言模型的剪枝方法、装置、存储介质及计算机设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大语言模型的剪枝方法、装置、存储介质及计算机设备
申请号:CN202411727166
申请日期:2024-11-27
公开号:CN119647623A
公开日期:2025-03-18
类型:发明专利
摘要
本申请涉及大模型和金融科技技术领域,公开了一种大语言模型的剪枝方法、装置、存储介质及计算机设备,该方法包括:获取待剪枝的大语言模型,确定所述大语言模型中的冗余层;提取所述冗余层的权重矩阵,并对所述权重矩阵进行奇异值分解,确定所述权重矩阵对应的多个奇异值;基于所述大语言模型对应的辅助校准数据集,计算每个奇异值对下游任务的性能影响,根据每个奇异值的性能影响确定多个奇异值中待保留的目标奇异值;根据所述目标奇异值对所述权重矩阵进行低秩分解,并将所述权重矩阵替换为低秩分解得到的低秩矩阵。实现了对大语言模型的剪枝补偿,在减少大语言模型的参数量的同时,保证了大语言模型的性能。
技术关键词
大语言模型 矩阵 冗余 剪枝方法 计算机设备 校准 金融科技技术 数据 剪枝装置 处理器 模块
系统为您推荐了相关专利信息
突发噪声 噪声地图 交通监控数据 热力图 吸声
数据分析方法 剪枝模型 时序 数据分析系统 数据压缩方法
机械臂关节 反馈控制器 力矩 参数 信号
知识库构建方法 大语言模型 文本 因子 构建系统
摄像仪 机器视觉识别系统 计数显示器 中央控制系统 机器视觉系统