一种基于低秩张量环分解的多优化目标大模型参数压缩方法

申请号：CN202510693866

申请日期：2025-05-27

公开号：CN120598046A

公开日期：2025-09-05

类型：发明专利

摘要

本发明公开了一种基于低秩张量环分解的多优化目标大模型参数压缩方法，实现参数的压缩，提高模型的运行效率。利用张量分解计算实现参数的压缩，其方法包括(1)处理输入数据，对Transformer自注意力层的原始权重矩阵进行重塑，得到高维张量其中d1×d2×…×dn＝d×d。(2)进行Tensor Ring(TR)分解，利用Tensor Ring(TR)分解将高维张量W分解为N个核心张量，并在在每个核心张量后面加上一个秩控制对角矩阵P。(3)进行联合优化，构造了一种多优化目标的损失优化策略，通过对任务损失、重构误差的综合考虑，实现在模型性能和压缩率之间取得平衡。本发明所采用的联合优化目标策略有效的平衡了任务损失和重构误差，极大的提高了参数压缩后模型的性能。

技术关键词

参数压缩方法重构误差矩阵核心注意力重塑方法分解特征梯度下降法数据策略强度索引变量环状样本算法元素

系统为您推荐了相关专利信息

一种注入不确定性的交流电网鲁棒拓扑控制方法及系统

拓扑控制方法线路发电调度方法母线变量

一种红外线照射点位置识别方法、系统及计算机程序

位置识别方法红外摄像头畸变参数坐标屏幕

基于马尔科夫扩散核的图神经网络模型及应用与框架扩展

神经网络模型节点特征卷积模块转移概率矩阵设施

一种激光气体分析装置

激光气体分析装置重构电信号启发式算法矩阵

基于少样本点云特征提取的海洋生物语义分割方法及装置

点云特征提取语义分割方法矩阵样本邻域特征