基于深度强化学习的多目标部署快速优化方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于深度强化学习的多目标部署快速优化方法
申请号:CN202510461740
申请日期:2025-04-14
公开号:CN120317435A
公开日期:2025-07-15
类型:发明专利
摘要
本发明提出基于深度强化学习的多目标部署快速优化方法。本发明创新性地提出了利用深度强化学习算法强大的环境理解能力和泛化能力处理复杂优化问题的思路,基于TD3算法构建的模型使智能体通过与环境交互学习优化决策策略。初步实验显示,该模型虽能较好理解环境,但前期学习效率低、策略收敛慢。为此,本发明又进一步提出了基于预训练的强化学习模型,通过传统优化算法提供预训练目标,加速学习过程并提高收敛质量。实验证明,预训练智能体在收敛速度和质量上均优于未经预训练的智能体。
技术关键词
深度强化学习算法 网络 训练智能体 智能体模型 强化学习模型 启发式算法 计算机 处理器 数据 可读存储介质 变量 存储器 策略 参数 电子设备 指令 思路