基于好奇心机制下的多智能体经验探索协同方法

申请号：CN202411006183

申请日期：2024-07-25

公开号：CN119150914A

公开日期：2024-12-17

类型：发明专利

摘要

本发明公开了基于好奇心机制下的多智能体经验探索协同方法，包括构建多智能体决策架构；构建适用于多智能体决策架构的好奇心机制；构建适用于多智能体决策架构的经验探索组件；构建经验回放池与状态回放池；适配多智能体协作对抗环境；对得到的基于好奇心机制下的多智能体经验探索决策架构所构成的深度神经网络进行训练，得到多智能体经验探索协同策略模型；在多智能体经验探索协同策略模型中，对当前对抗场景下的多智能体协作对抗策略进行求解。通过上述方式，本发明能够平衡多智能体算法在训练时探索与利用的过程，缓解多智能体对抗环境中奖励稀疏性所带来的影响，帮助多智能体进行有经验地探索，为对抗寻找的最优策略的同时提高了学习的效率。

技术关键词

协同方法多智能体协作神经网络参数机制车辆自动驾驶控制系统策略矩阵决策深度神经网络多层感知器多智能体强化学习混合网络模型收集训练数据超网络场景贝叶斯方法前馈神经网络对抗系统