模型训练方法、装置、设备及存储介质

申请号：CN202510900699

申请日期：2025-06-30

公开号：CN120822567A

公开日期：2025-10-21

类型：发明专利

摘要

本公开提供了模型训练方法、装置、设备及存储介质，涉及计算机技术领域，尤其涉及神经网络模型、模型训练技术领域。具体实现方案为：由计算单元对存储于存储器中的目标模型的激活张量和权重张量，执行基于哈达玛预变换的量化矩阵乘法，以基于数据位宽更小的低精度张量生成线性层的输出张量；利用输出张量和所述目标模型的后续网络层完成前向传播，以得到损失值；根据损失值，通过反向传播算法更新存储于存储器中的目标模型的模型参数。利用本公开的技术方案，能够在保证模型训练精度的前提下，显著降低计算过程中的存储器资源占用和计算量，降低了训练成本。

技术关键词

传播算法模型训练方法精度因子矩阵格式存储器数值模型训练技术优化器模型训练装置分布式训练参数线性神经网络模型计算机程序产品处理器通信信息更新

系统为您推荐了相关专利信息

改善FCBGA印刷锡球空洞的方法

空洞锡球超声波清洗方法气氛控制焊料合金

一种锂离子电池均衡策略系统

单体电池均衡电池状态监测模块锂离子电池组电池均衡策略技术

一种海洋表面的盐度反演方法、系统、设备及存储介质

数据反演方法动态门控补丁标志位

一种基于BayesFlow的桥梁概率有限元模型更新方法

模型更新方法参数桥梁概率密度函数 ANSYS软件

一种基于多层土壤结构的海岸接地极布置优化方法、装置、终端设备及存储介质

布置优化方法跨步电压土壤电阻率仿真模型数据获取模块