模型推理调度方法及系统、电子设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
模型推理调度方法及系统、电子设备和存储介质
申请号:CN202511415359
申请日期:2025-09-29
公开号:CN120909737B
公开日期:2025-12-09
类型:发明专利
摘要
本公开提供了一种模型推理调度方法及系统、电子设备和存储介质,该系统包括多个预填充服务器节点和多个解码服务器节点,方法包括:响应于接收到用户请求信息,结合基于深度强化学习的预填充调度模型,获取从多个预填充服务器节点中选择的目标预填充服务器节点和第一优先级;向目标预填充服务器节点中的与第一优先级对应的请求队列发送预填充请求,令目标预填充服务器节点处理预填充请求;预填充请求处理完成,结合基于深度强化学习的解码调度模型,获取从多个解码服务器节点中选择的目标解码服务器节点和第二优先级;向目标解码服务器节点中的与第二优先级对应的请求队列发送解码请求,令目标解码服务器节点处理解码请求;提升推理效率。
技术关键词
服务器节点 解码服务器 深度强化学习 时间预测模型 多级反馈队列 策略 键值 数据训练神经网络 调度系统 电子设备 计算机程序产品 参数 处理器通信