一种结合强化学习与最优控制的轨道博弈系统及方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种结合强化学习与最优控制的轨道博弈系统及方法
申请号:CN202510623312
申请日期:2025-05-15
公开号:CN120524808A
公开日期:2025-08-22
类型:发明专利
摘要
本申请提出一种结合强化学习与最优控制的轨道博弈系统及方法,其中,系统包括:初始化问题设置模块、优化求解模块、强化学习模块、虚拟环境模块与循环执行模块,该系统通过初始化虚拟环境与约束条件,利用优化求解模块基于CW方程求解航天器轨道控制量,结合强化学习模块中的TD3算法生成最终控制策略。本申请提出的系统在虚拟环境中考虑J2摄动影响,持续迭代并优化控制策略,在不完全信息和非线性扰动下实现高效可靠的轨道追逃博弈,适用于复杂空间环境下的多航天器自主决策任务。
技术关键词
坐标系 计算机执行指令 更新网络参数 模块 强化学习网络 决策 航天器轨道控制 方程 虚拟环境交互 加速度 优化控制策略 追逃博弈 博弈方法 可读存储介质 计算机程序产品 处理器 算法