摘要
本发明涉及超高速可编程数据平面技术领域,公开了一种面向可编程交换机的快速推理部署方法及装置,包括:获取用于训练神经网络模型的训练数据集;基于训练数据集,确定神经网络模型对应的第一查找表;获取神经网络模型对应的神经网络模型计算图;基于神经网络模型计算图和第一查找表,将神经网络需要量化的算子集成到第二查找表,并将第二查找表部署在可编程交换机中;可编程交换机接收数据包,并对数据包进行数据推理得到推理结果。本发明利用可编程交换机的编程能力,在进行数据包交换的同时,通过可编程数据平面的线速流表资源实现预先训练好的神经网络模型,完成数据平面的数据包推理任务,节约了计算资源,实现了高速率的推理任务。