摘要
本发明公开一种在量化感知训练中目标检测模型的处理方法。深度模型通常具有庞大的参数量以及复杂的计算过程,导致在移动设备和嵌入式设备等资源受限的平台上的部署和应用受到限制。将浮点数二值化为1‑bit可以极大减少存储空间,并提升推理的计算速度,有效解决资源受限问题。在二值化场景中,为了减少计算量,BN层通常会和卷积层进行融合,造成权重的偏差,对性能造成影响。本发明通过基于训练后量化的BN融合策略BQ‑P和基于BN层折叠的量化感知训练策略BNF‑QAT,使得深度神经网络二值化权重的最终精度不会受到BN层参数融合的影响,保持BN融合带来的计算速度提升的同时,消除BN层融合对任务性能的不利影响。