一种基于改进元学习的优化深度强化学习集群调度的方法

申请号：CN202510471169

申请日期：2025-04-15

公开号：CN120317335A

公开日期：2025-07-15

类型：发明专利

摘要

本发明公开了一种基于改进元学习的优化深度强化学习集群调度的方法，属于计算机集群调度技术领域。针对深度强化学习在调度任务中泛化能力不足和训练缓慢的问题，提出一种改进的元学习机制，通过引入扩散模型的数据生成模块和经验回放模块，对元学习的训练数据与经验利用方式进行改进。扩散模型的数据生成模块能够合成多样化的训练数据，显著增强元学习训练数据的泛化性；经验回放模块通过整合历史经验与生成的合成经验，改进元学习跨任务知识的提取效率。基于上述改进的元学习机制，深度强化学习智能体可在面对复杂动态的环境时更快速地实现参数初始化与策略微调，使调度策略具备更强的泛化能力和更高的训练效率，有效提升集群调度的整体性能。

技术关键词

深度强化学习回放模块参数调度算法数据集群调度技术缓冲池多层感知机样本网络梯度下降法序列噪声强度注意力机制令牌策略