一种深度神经网络的自适应量化方法、系统及产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种深度神经网络的自适应量化方法、系统及产品
申请号:CN202410951375
申请日期:2024-07-16
公开号:CN118839736A
公开日期:2024-10-25
类型:发明专利
摘要
本申请实施例提供一种深度神经网络的自适应量化方法、系统及产品,该方法包括:对原始浮点模型的模型层设置量化组合节点,构建目标浮点模型;对目标浮点模型进行训练后量化,确定量化组合节点的量化参数;通过量化参数对量化组合节点进行量化参数设置,获得第一量化模型;在性能不满足设定条件情况下,将输入量化组合节点的量化节点的浮点数与该量化组合节点的反量化节点输出的浮点数进行对比,获得量化误差;根据获得的量化误差,确定第一量化模型中模型层的量化损失;根据量化损失,确定优化层;对优化层的量化位宽进行增加,并重新确定量化组合节点的量化参数,以构建新的量化模型。旨在提升模型的量化误差评估准确性。
技术关键词
深度神经网络 量化误差 节点 浮点数 参数 深度学习模型 嵌入式平台 量化系统 可读存储介质 处理器 模块 存储器 计算机 数据 电子设备