推理方法、系统、计算机设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
推理方法、系统、计算机设备及存储介质
申请号:CN202411368534
申请日期:2024-09-29
公开号:CN119378681B
公开日期:2025-10-10
类型:发明专利
摘要
本申请公开一种推理方法、系统、计算机设备及存储介质。所述方法应用于包括中央处理单元CPU、图形处理单元GPU和现场可编程门阵列FPGA的目标系统,包括以下步骤:响应于目标推理服务的请求,CPU将目标推理服务的目标输入传到GPU;GPU基于大语言模型的网络结构和权重参数对目标输入进行预填充阶段的计算,得到包括预填充阶段的中间计算结果和最终计算结果的第一数据,并将其传到CPU;CPU将第一数据传到FPGA;FPGA基于大语言模型的网络结构、权重参数和第一数据进行解码阶段的计算,得到第二数据将其传到CPU;CPU将第二数据作为目标推理服务的输出。本申请能够将目标推理服务分阶段部署到GPU和FPGA,通过协作运行的方式完成目标推理服务,充分利用GPU和FPGA的硬件资源。
技术关键词
推理方法 大语言模型 网络结构 现场可编程门阵列 解码器 图形处理单元 数据 样本 计算机设备 接口 任务调度 参数 关系 推理系统 可读存储介质 处理器 分阶段