一种多出口场景下基于深度强化学习的多智能体疏散方法
申请号:CN202410755882
申请日期:2024-06-12
公开号:CN118536540A
公开日期:2024-08-23
类型:发明专利
摘要
本发明涉及一种多出口场景下基于深度强化学习的多智能体疏散方法,主要解决现有技术中存在的多智能体疏散模型受限于特定规则和模型、泛化性差难以灵活应对多出口场景的问题。它包括五个步骤:1)初始化环境并设置训练参数。2)收集经验数据并更新经验数据缓冲区,通过混合动作控制智能体运动,设计复合奖励函数计算即时奖励。3)经验回放与模型更新,利用想象力机制优化价值网络。4)模型测试。5)中间结果可视化与模型存储。本发明方法能够应对不同的复杂环境,增强了算法的学习效率和泛化能力,能够使智能体探索到更多可行路径,有效解决复杂和动态变化的场景下的疏散任务。同时,降低了智能体在疏散过程中的碰撞风险,并提高了疏散效率。
技术关键词
深度强化学习
策略
场景
模型更新
控制智能体
参数
可视化方式
优化器
机制
生成动作
鲁棒性
指标
速度
决策
网络结构
算法
数据存储
变量