概述
多目标优化调度不仅考虑简单的资源余量,更会综合分析任务类型(如训练/推理)、数据 locality、网络带宽、硬件兼容性(如CUDA版本)、服务等级协议(SLA)和实时价格等因素,将用户的计算任务最优地调度到最合适的计算节点上。
需求详情
多目标优化调度应实现以下功能:a) 调度引擎:综合考量业务类型(如实时推理、离线训练)、资源状态(如算力使用率、存储余量)、网络延迟、能耗成本等关键因素,自动筛选最优调度策略,实现任务从接收、分发到部署、处理的全流程自动化执行,保障任务高效落地;b) 策略管理:支持调度策略的全生命周期操作,包括策略配置、删除、修改与查询,满足不同业务场景下的策略调整需求;同时支持策略的插件式扩展,可灵活接入自定义策略模块,且能对新策略进行仿真评估,验证其在实际场景中的适配性与有效性;c) 资源优化:以保障用户业务服务质量(如响应时延、任务完成率)为核心目标,实时捕捉业务运行情况(如任务执行进度、异常反馈)与资源实时状态(如节点负载波动、资源空闲情况),动态调整资源分配方案,实现资源的合理调配与高效利用,避免资源浪费或过载。
技术参数
1、调度决策维度:系统需综合感知任务属性(如训练/推理、硬件依赖)、实时资源状态(如GPU利用率、节点负载、网络带宽)与服务等级协议(SLA)、成本等多维度因素,为调度决策提供输入。2、优化算法与策略:调度核心需采用多目标优化算法(如强化学习),能够在成本、效率、时延等目标间进行智能权衡与寻优。策略引擎应支持插件化扩展与仿真评估,允许自定义策略的灵活接入与验证。3、跨域资源调度:具备跨不同云平台与异构算力节点的统一调度能力,能根据策略自动完成资源的分配与应用部署。支持运行中任务的资源动态调整与弹性伸缩。4、系统性能与集成:调度服务需提供标准RESTful API,便于系统集成。单次调度决策平均响应时间应低于500毫秒,并保证系统的高可用性(≥99.9%)。
项目预期
通过多目标优化调度将业务需求(如低延迟、高吞吐)、行业特性(如生物计算需大内存、自动驾驶需高性能GPU)和经济性(成本最优)等多个有时相互冲突的目标纳入统一调度算法模型中,实现智能化、多目标的权衡与最优解寻找。实现了跨越不同管理域(不同云平台、不同智算中心)和不同地理区域的无缝调度。调度指令可以穿透各资源平台的接口,完成资源的分配、应用的部署和数据的迁移。
已过期:截止至2025-11-30
金额:10万元-50万元