摘要
本发明公开了一种基于集成强化学习的应急防护场所多目标选址优化方法,属场所选址优化领域,包括S1:获取区域内的候选点、需求点数据,构建多目标强化学习问题;S2:进行马尔可夫建模,基于单智能体决策深度强化学习问题;S3:构建集成强化学习架构;S4:对构建的集成强化学习网络进行训练;S5:利用集成强化学习框架得到选址结果,并进行可视化呈现;本发明引入了集成学习策略和自适应优化技术,结合以遥感与地理信息系统核心的空间信息技术,实现了城市应急防护场所多目标选址优化,通过Actor‑Critic网络的聚合增强模型鲁棒性和实用性。