摘要
本申请提供一种深度神经网络推理加速方法及系统,涉及深度学习技术领域,包括基于预设数据集构建初始推理加速模型;根据局部敏感哈希技术检测初始推理加速模型中任一层的神经元的稀疏程度,根据稀疏程度动态调整神经元的激活阈值;基于贝叶斯优化算法,对动态调整激活阈值后的初始推理加速模型进行剪枝操作,得到目标推理加速模型;利用目标推理加速模型执行图像分类任务,以通过目标推理加速模型输出推理结果。本申请通过动态调整神经元激活阈值和分层剪枝策略,结合局部敏感哈希技术及贝叶斯优化,实现深度神经网络在边缘计算设备上的高效推理加速,同时最小化对模型精度的影响,提升模型在低功耗条件下的推理性能和实用性。