大语言模型的剪枝方法、装置、存储介质及计算机设备

申请号：CN202411727166

申请日期：2024-11-27

公开号：CN119647623A

公开日期：2025-03-18

类型：发明专利

摘要

本申请涉及大模型和金融科技技术领域，公开了一种大语言模型的剪枝方法、装置、存储介质及计算机设备，该方法包括：获取待剪枝的大语言模型，确定所述大语言模型中的冗余层；提取所述冗余层的权重矩阵，并对所述权重矩阵进行奇异值分解，确定所述权重矩阵对应的多个奇异值；基于所述大语言模型对应的辅助校准数据集，计算每个奇异值对下游任务的性能影响，根据每个奇异值的性能影响确定多个奇异值中待保留的目标奇异值；根据所述目标奇异值对所述权重矩阵进行低秩分解，并将所述权重矩阵替换为低秩分解得到的低秩矩阵。实现了对大语言模型的剪枝补偿，在减少大语言模型的参数量的同时，保证了大语言模型的性能。

技术关键词

大语言模型矩阵冗余剪枝方法计算机设备校准金融科技技术数据剪枝装置处理器模块

系统为您推荐了相关专利信息

基于多源数据融合的宁静小区噪声地图构建与评估方法

突发噪声噪声地图交通监控数据热力图吸声

一种基于区块链的数据处理及数据分析系统及方法

数据分析方法剪枝模型时序数据分析系统数据压缩方法

一种机械设备的控制方法、装置、计算机设备及存储介质

机械臂关节反馈控制器力矩参数信号

一种基于大语言模型的轨道交通知识库构建方法及系统

知识库构建方法大语言模型文本因子构建系统

一种托盘自动检测计数叠码装置及仓储配套自动化流程

摄像仪机器视觉识别系统计数显示器中央控制系统机器视觉系统