一种深度神经网络的自适应量化方法、系统及产品

申请号：CN202410951375

申请日期：2024-07-16

公开号：CN118839736A

公开日期：2024-10-25

类型：发明专利

摘要

本申请实施例提供一种深度神经网络的自适应量化方法、系统及产品，该方法包括：对原始浮点模型的模型层设置量化组合节点，构建目标浮点模型；对目标浮点模型进行训练后量化，确定量化组合节点的量化参数；通过量化参数对量化组合节点进行量化参数设置，获得第一量化模型；在性能不满足设定条件情况下，将输入量化组合节点的量化节点的浮点数与该量化组合节点的反量化节点输出的浮点数进行对比，获得量化误差；根据获得的量化误差，确定第一量化模型中模型层的量化损失；根据量化损失，确定优化层；对优化层的量化位宽进行增加，并重新确定量化组合节点的量化参数，以构建新的量化模型。旨在提升模型的量化误差评估准确性。

技术关键词

深度神经网络量化误差节点浮点数参数深度学习模型嵌入式平台量化系统可读存储介质处理器模块存储器计算机数据电子设备