基于连续时间近端策略优化强化学习算法的卫星轨道控制方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于连续时间近端策略优化强化学习算法的卫星轨道控制方法
申请号:CN202511243345
申请日期:2025-09-02
公开号:CN120722768B
公开日期:2025-10-31
类型:发明专利
摘要
本发明公开了一种基于连续时间近端策略优化强化学习算法的卫星轨道控制方法,包括以下步骤:步骤1、基于连续时间近端策略优化强化学习算法,确定卫星采取的动作即加速度,以及动作的执行时间;步骤2、基于步骤1得到的卫星采取的动作以及执行的时间,实现对卫星轨道控制。本发明通过结合先进的近端策略优化强化学习算法(PPO)与连续时间控制框架,提供了一种高精度、稳定且能效优化的卫星轨道控制解决方案,具有显著的技术先进性和广泛的应用前景,为未来的空间探索和卫星运营提供了强有力的技术支持。
技术关键词
卫星轨道控制方法 强化学习算法 加速度 状态更新 估计方法 深度神经网络训练 ReLU函数 方程 参数 广义 策略更新 偏差 框架 比率 轨迹 因子 数据