摘要
本发明公开了基于好奇心机制下的多智能体经验探索协同方法,包括构建多智能体决策架构;构建适用于多智能体决策架构的好奇心机制;构建适用于多智能体决策架构的经验探索组件;构建经验回放池与状态回放池;适配多智能体协作对抗环境;对得到的基于好奇心机制下的多智能体经验探索决策架构所构成的深度神经网络进行训练,得到多智能体经验探索协同策略模型;在多智能体经验探索协同策略模型中,对当前对抗场景下的多智能体协作对抗策略进行求解。通过上述方式,本发明能够平衡多智能体算法在训练时探索与利用的过程,缓解多智能体对抗环境中奖励稀疏性所带来的影响,帮助多智能体进行有经验地探索,为对抗寻找的最优策略的同时提高了学习的效率。