一种深度神经网络加速推理方法、装置及存储介质

申请号：CN202510073434

申请日期：2025-01-17

公开号：CN119476356B

公开日期：2025-05-16

类型：发明专利

摘要

本申请公开了一种深度神经网络加速推理方法、装置及存储介质。本申请方法包括：对标准数据集进行预处理，使用训练集训练深度神经网络模型；记录每层神经元或连接的权重分布以及L1范数；基于训练过程中记录的权重分布和L1范数，确定神经元或连接的重要性数值；按照预设比例剪除重要性数值低于预设的重要性阈值的神经元或连接，并在每次剪枝后动态调整深度神经网络模型的结构；确定量化位宽以及量化上下限值；对剪枝后的深度神经网络模型，基于量化位宽和量化上下限值，对权重和激活值进行假量化处理基于假量化后的结果，计算任务损失和量化误差损失，并更新全精度权重；使用联合损失函数优化模型参数。

技术关键词

深度神经网络模型联合损失函数量化误差推理方法构建深度神经网络输入输出单元图像处理训练集推理装置数值训练深度神经网络多层感知机浮点数同义词精度可读存储介质动态申请方法数据

系统为您推荐了相关专利信息

一种基于深度学习的设备异常声音检测方法

异构特征深度神经网络模型半监督学习方法异常声音深度神经网络学习

一种基于全局建模与融合优化的配电台区净负荷预测方法

净负荷预测方法负荷预测模型周期结构模型预测值分布式发电

文本单位关系式推理方法及装置、存储介质和终端

文本推理方法语义关系推理装置

一种基于显微图像的PCB焊点缺陷检测方法及装置

焊点缺陷检测方法焦点损失函数联合损失函数融合特征检测头

基于YOLO系列算法的复杂场景下车辆与行人目标检测方法

物体检测模型深度神经网络模型系列算法车辆