摘要
本发明涉及智能体路径规划技术领域,尤其涉及一种陆上无人车协同搜救仿真方法,包括步骤:基于搜救场景建立包含多个无人车的搜救仿真环境;每个无人车实时获取所有无人车的状态;每个无人车将获取的状态传输给神经网络模型及其他无人车,神经网络模型根据输入的状态信息生成每辆无人车的动作概率分布,每辆无人车基于当前策略及对应的动作概率分布选择最优的动作;每辆所述无人车执行最优的动作并与其他无人车协作后,所述搜救仿真环境生成了奖励和新的状态;对神经网络模型进行训练和更新;直至策略收敛或者达到设定的训练轮次为止,本发明利用基于奖励中心的近端策略优化算法,优化搜索策略,提升任务完成效率。