基于深度强化学习的多目标部署快速优化方法

申请号：CN202510461740

申请日期：2025-04-14

公开号：CN120317435A

公开日期：2025-07-15

类型：发明专利

摘要

本发明提出基于深度强化学习的多目标部署快速优化方法。本发明创新性地提出了利用深度强化学习算法强大的环境理解能力和泛化能力处理复杂优化问题的思路，基于TD3算法构建的模型使智能体通过与环境交互学习优化决策策略。初步实验显示，该模型虽能较好理解环境，但前期学习效率低、策略收敛慢。为此，本发明又进一步提出了基于预训练的强化学习模型，通过传统优化算法提供预训练目标，加速学习过程并提高收敛质量。实验证明，预训练智能体在收敛速度和质量上均优于未经预训练的智能体。

技术关键词

深度强化学习算法网络训练智能体智能体模型强化学习模型启发式算法计算机处理器数据可读存储介质变量存储器策略参数电子设备指令思路