基于资源预测与动作突变的强化学习调度方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于资源预测与动作突变的强化学习调度方法及系统
申请号:CN202411512545
申请日期:2024-10-28
公开号:CN119512703A
公开日期:2025-02-25
类型:发明专利
摘要
本发明提供了一种异构云环境下基于资源预测与动作突变的强化学习调度方法及系统,该方法包括:获取任务等待队列中任务的数量;若达到预设数量阈值,则获取节点当前的状态信息,以及基于预训练的预测网络进行预测得到执行时刻的状态信息;进行特征提取和编码得到节点状态向量、任务特征向量;合并得到合并向量输入强化学习模型,生成决策策略;对决策策略基于预设概率向目标类型的节点突变分配任务,得到最终的决策策略。本发明实施例可以通过预测网络预测节点状态,然后将节点状态和任务需求输入到强化学习框架得到调度决策,进而使异构云计算系统任务完成率、资源利用率得到提高,能耗得到降低。
技术关键词
强化学习调度方法 强化学习模型 节点 决策 策略 队列 强化学习框架 网络 异构 矩阵 误差 资源 编码 调度系统 算法模型 因子 能耗 序列