一种任务导向群体博弈的非对称能力博弈学习方法

申请号：CN202411377559

申请日期：2024-09-30

公开号：CN118898297A

公开日期：2024-11-05

类型：发明专利

摘要

本发明公开了一种任务导向群体博弈的非对称能力博弈学习方法，属于模式识别与智能系统领域，包括以下步骤：步骤S1、博弈双方分别依据非对称先验认知构造对手模型；步骤S2、博弈双方分别针对构造的对手模型确定优化的博弈解；步骤S3、博弈双方根据博弈解分别构造任务导向的群体博弈强化学习模型；步骤S4、博弈双方基于分布式训练优化步骤S3中构造的群体博弈强化学习模型，获得博弈策略；步骤S5、博弈双方在真实对手环境中进行博弈对抗，验证博弈策略的性能；本发明提供的一种任务导向群体博弈的非对称能力博弈学习方法，通过设计任务导向自我博弈强化学习算法进行非对称能力博弈参与方的策略优化，加速了博弈策略的学习。

技术关键词

学习方法强化学习模型策略强化学习算法分布式训练智能系统模式识别网络变量样本关系参数