摘要
本发明提供一种基于专家知识辅助深度强化学习的集群对抗方法和系统,通过引入专家知识库和模仿学习技术,结合深度强化学习,优化智能体的协同决策效率,从而提升系统的初始策略学习速度和整体作战效能。该方法旨在提供有效的初始策略获取机制,利用专家知识库加速智能体的早期策略学习,降低训练时间,同时通过多智能体深度强化学习算法优化智能体在复杂动态环境中的策略,提高协同作战能力。本方案可大幅缩短初始策略学习所需时间,结合深度强化学习得到更优化的策略,保障策略调优的高效性,进而保证大规模集群对抗中的实时性保障。