基于压缩权重的模型训练与推理方法、装置、设备及存储介质
申请号:CN202411810402
申请日期:2024-12-10
公开号:CN119740623A
公开日期:2025-04-01
类型:发明专利
摘要
本申请公开了一种基于压缩权重的模型训练与推理方法、装置、设备及存储介质,涉及模型训练与推理技术领域,公开了基于压缩权重的模型训练与推理方法,包括:获取预设模型的初始权重矩阵;根据初始权重矩阵得到初始权重矩阵块,并根据初始权重矩阵块得到初始权重;根据初始权重得到权重指数位和权重尾数位,并根据权重指数位得到尾数保留值;根据权重指数位、尾数保留值以及和权重尾数位对初始权重进行压缩,得到压缩权重;在检测到预设模型的前向传播或反向传播时,解压压缩权重,得到目标权重,并根据目标权重对预设模型进行训练和推理。通过将模型权重的指数位和尾数保留值对权重进行压缩和解压,能够在保持模型性能的同时减少内存占用。
技术关键词
推理方法
指数
矩阵
推理技术
推理装置
策略更新
处理器
模块
误差
可读存储介质
存储器
分块
内存
符号
计算机
编码