一种推理资源优化方法、装置及电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种推理资源优化方法、装置及电子设备
申请号:CN202410942759
申请日期:2024-07-15
公开号:CN118796471B
公开日期:2025-09-30
类型:发明专利
摘要
本申请提供一种推理资源优化方法、装置及电子设备,该方法包括:获取神经网络模型在不同硬件资源下的推理服务响应性能数据,以及在不同硬件资源下的硬件成本数据;对推理服务响应性能数据和硬件成本数据进行优化建模,获得硬件成本最小的硬件资源部署方案;根据硬件成本最小的硬件资源部署方案生成神经网络模型的配置文件;根据配置文件对神经网络模型和不同硬件资源进行自适应调度优化。在上述方案的实现过程中,通过对推理服务响应性能数据和硬件成本数据进行优化建模,并根据获得硬件成本最小的硬件资源部署方案生成的配置文件,对神经网络模型和不同硬件资源进行自适应调度优化,从而有效地提高了硬件资源的利用率。
技术关键词
整数线性规划 服务器内存 资源优化方法 加速器 生成神经网络模型 机器可读指令 参数 资源调度优化 推理服务器 令牌 电子设备 处理器 可读存储介质 数据获取模块 计算机程序产品