一种面向可编程交换机的快速推理部署方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种面向可编程交换机的快速推理部署方法及装置
申请号:CN202411572237
申请日期:2024-11-06
公开号:CN119090019B
公开日期:2025-02-28
类型:发明专利
摘要
本发明涉及超高速可编程数据平面技术领域,公开了一种面向可编程交换机的快速推理部署方法及装置,包括:获取用于训练神经网络模型的训练数据集;基于训练数据集,确定神经网络模型对应的第一查找表;获取神经网络模型对应的神经网络模型计算图;基于神经网络模型计算图和第一查找表,将神经网络需要量化的算子集成到第二查找表,并将第二查找表部署在可编程交换机中;可编程交换机接收数据包,并对数据包进行数据推理得到推理结果。本发明利用可编程交换机的编程能力,在进行数据包交换的同时,通过可编程数据平面的线速流表资源实现预先训练好的神经网络模型,完成数据平面的数据包推理任务,节约了计算资源,实现了高速率的推理任务。
技术关键词
二叉决策树 可编程交换机 查找表 三态内容寻址存储器 训练神经网络模型 数据 节点 非临时性计算机可读存储介质 决策树算法 流水线 索引 解析器 无监督 线性 模块 处理器通信 网口 结点