一种智能调度方法、装置、设备及存储介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种智能调度方法、装置、设备及存储介质
申请号:
CN202411688867
申请日期:
2024-11-25
公开号:
CN119721116A
公开日期:
2025-03-28
类型:
发明专利
摘要
本发明涉及一种智能调度方法,获取当前环境的状态信息;根据所述状态信息确定当前环境对应的补偿参数;将所述补偿参数输入至预设训练模型,输出对应的补偿动作;执行所述补偿动作,以实现智能调度;综合DQN算法、经验回放缓冲区和目标网络的优点,提出了深度确定策略梯度(DDPG)算法来解决连续状态行为空间中的深度强化学习问题。然而,由于DDPG算法中Actor网络和Q函数之间的相互作用,使得算法通常难以达到稳定,因此很难直接将DDPG算法应用到复杂的高维多智能体环境。
技术关键词
噪声参数
智能调度方法
智能调度装置
DQN算法
深度强化学习
处理器
模块
存储器
坐标
电子设备
网络
速度
策略