目标检测深度学习算法后处理的硬件友好的整数量化方法
申请号:CN202411825526
申请日期:2024-12-12
公开号:CN119784999A
公开日期:2025-04-08
类型:发明专利
摘要
本发明提供一种目标检测深度学习算法后处理的硬件友好的整数量化方法,涉及目标检测深度学习算法技术领域,其主要步骤为:将检测头的分类分支和回归分支的输出特征图作为后处理的输入特征图;生成量化的乘法因子MULT和移位因子SHIFT,完成后处理的输入的量化;进行后处理,然后输出预测框;完成锚点生成的量化;完成预测框左上角和右下角坐标的计算;完成反量化后的预测框的计算。本发明选择2的负整数幂作为后处理输入的量化比例因子,预测框的相关计算从32浮点数转换成位数较少的整数运算,可以减少计算资源和计算带宽,提高推理速度,满足实时性的需求。
技术关键词
深度学习算法技术
浮点数
分支
因子
锚点
坐标
输出特征
解耦结构
置信度阈值
尺寸
检测头
索引
定义
速度