一种基于强化学习的智能兵棋推演方法

申请号：CN202510461943

申请日期：2025-04-14

公开号：CN120449646A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了一种基于强化学习的智能兵棋推演方法，包括：构建动态战场模型：构建可调整的战场模拟平台，定义战场中的地形、资源、部队分布要素；生成强化学习策略并优化：设计一种基于深度强化学习的智能策略生成算法，通过构建状态空间和动作空间，结合局面奖励函数，在多轮训练中生成高效的作战策略；制定红蓝对抗机制：引入双智能体对弈训练机制，将黑方与白方分别建模为强化学习智能体，将红蓝双方分别建模为强化学习智能体，通过多轮交替训练模拟真实的战场博弈；可视化推演结果：提供动态决策可视化功能，能够实时展示战场态势、部队动态和策略执行过程；本发明解决了现有技术中规则固化、策略生成能力有限以及对抗性不足等问题。

技术关键词

推演方法强化学习策略强化学习模型深度强化学习战场环境部队深度Q学习地图可视化功能生成算法机制模拟平台资源网格柱状图形式定义动态更新优化网络参数