一种结合强化学习与最优控制的轨道博弈系统及方法

申请号：CN202510623312

申请日期：2025-05-15

公开号：CN120524808A

公开日期：2025-08-22

类型：发明专利

摘要

本申请提出一种结合强化学习与最优控制的轨道博弈系统及方法，其中，系统包括：初始化问题设置模块、优化求解模块、强化学习模块、虚拟环境模块与循环执行模块，该系统通过初始化虚拟环境与约束条件，利用优化求解模块基于CW方程求解航天器轨道控制量，结合强化学习模块中的TD3算法生成最终控制策略。本申请提出的系统在虚拟环境中考虑J2摄动影响，持续迭代并优化控制策略，在不完全信息和非线性扰动下实现高效可靠的轨道追逃博弈，适用于复杂空间环境下的多航天器自主决策任务。

技术关键词

坐标系计算机执行指令更新网络参数模块强化学习网络决策航天器轨道控制方程虚拟环境交互加速度优化控制策略追逃博弈博弈方法可读存储介质计算机程序产品处理器算法