摘要
本发明公开了一种基于强化学习的智能兵棋推演方法,包括:构建动态战场模型:构建可调整的战场模拟平台,定义战场中的地形、资源、部队分布要素;生成强化学习策略并优化:设计一种基于深度强化学习的智能策略生成算法,通过构建状态空间和动作空间,结合局面奖励函数,在多轮训练中生成高效的作战策略;制定红蓝对抗机制:引入双智能体对弈训练机制,将黑方与白方分别建模为强化学习智能体,将红蓝双方分别建模为强化学习智能体,通过多轮交替训练模拟真实的战场博弈;可视化推演结果:提供动态决策可视化功能,能够实时展示战场态势、部队动态和策略执行过程;本发明解决了现有技术中规则固化、策略生成能力有限以及对抗性不足等问题。