一种深度神经网络加速推理方法、装置及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种深度神经网络加速推理方法、装置及存储介质
申请号:CN202510073434
申请日期:2025-01-17
公开号:CN119476356B
公开日期:2025-05-16
类型:发明专利
摘要
本申请公开了一种深度神经网络加速推理方法、装置及存储介质。本申请方法包括:对标准数据集进行预处理,使用训练集训练深度神经网络模型;记录每层神经元或连接的权重分布以及L1范数;基于训练过程中记录的权重分布和L1范数,确定神经元或连接的重要性数值;按照预设比例剪除重要性数值低于预设的重要性阈值的神经元或连接,并在每次剪枝后动态调整深度神经网络模型的结构;确定量化位宽以及量化上下限值;对剪枝后的深度神经网络模型,基于量化位宽和量化上下限值,对权重和激活值进行假量化处理基于假量化后的结果,计算任务损失和量化误差损失,并更新全精度权重;使用联合损失函数优化模型参数。
技术关键词
深度神经网络模型 联合损失函数 量化误差 推理方法 构建深度神经网络 输入输出单元 图像处理 训练集 推理装置 数值 训练深度神经网络 多层感知机 浮点数 同义词 精度 可读存储介质 动态 申请方法 数据
系统为您推荐了相关专利信息
异构特征 深度神经网络模型 半监督学习方法 异常声音 深度神经网络学习
净负荷预测方法 负荷预测模型 周期结构 模型预测值 分布式发电
文本 推理方法 语义 关系 推理装置
焊点缺陷检测方法 焦点损失函数 联合损失函数 融合特征 检测头
物体检测模型 深度神经网络模型 系列 算法 车辆