基于集成强化学习的应急防护场所多目标选址优化方法

申请号：CN202511244843

申请日期：2025-09-02

公开号：CN120806557B

公开日期：2025-12-05

类型：发明专利

摘要

本发明公开了一种基于集成强化学习的应急防护场所多目标选址优化方法，属场所选址优化领域，包括S1：获取区域内的候选点、需求点数据，构建多目标强化学习问题；S2：进行马尔可夫建模，基于单智能体决策深度强化学习问题；S3：构建集成强化学习架构；S4：对构建的集成强化学习网络进行训练；S5：利用集成强化学习框架得到选址结果，并进行可视化呈现；本发明引入了集成学习策略和自适应优化技术，结合以遥感与地理信息系统核心的空间信息技术，实现了城市应急防护场所多目标选址优化，通过Actor‑Critic网络的聚合增强模型鲁棒性和实用性。

技术关键词

选址优化方法深度强化学习集成学习策略强化学习网络强化学习框架特征提取网络空间信息技术更新网络参数强化学习模型神经网络结构地理信息系统通用特征决策因子线性计算方法鲁棒性