基于多智能体强化学习算法的无人机博弈对抗夺岛方法

申请号：CN202510189356

申请日期：2025-02-20

公开号：CN120031068A

公开日期：2025-05-23

类型：发明专利

摘要

本申请属于深度强化学习技术领域。本申请提供一种基于多智能体强化学习算法的无人机博弈对抗夺岛方法。本公开实施例在MADDPG算法中引入Rainbow算法模块，如优先经验回放、多步TD更新等，并使用行为克隆加快训练初期的收敛速度。显著提升了样本利用效率和策略的稳定性，使智能体能够在更复杂的任务环境中获得优异表现。设计了结合奖励返回值和战力保存率的奖励函数，不仅能够有效引导智能体完成夺岛任务目标，还鼓励智能体优化资源利用，减少任务过程中的战损。这样的奖励机制能够动态评估任务完成效果、策略效率以及资源消耗平衡，提升了智能体的策略学习能力。战力保存率的引入为强化学习任务提供了一个全新的优化维度。

技术关键词

多智能体强化学习无人机策略深度强化学习技术协同定位功能克隆技术动态环境参数仿真环境机制侦察机更新网络参数生成动作算法模块多频段损失率样本场景