摘要
本发明公开了一种基于月球通导星座的月面定位增强方法,该方法包括:构建深度学习环境;其中,深度学习环境包括动作空间、观测空间、潜在状态和奖励机制;以双层深度神经网络为基础架构,构建参与者‑评价者网络(Actor‑Critic Net)的深度强化学习模型;将所述深度强化学习模型和所述深度学习环境进行动态交互,利用随机梯度下降法最小化预设的损失函数,对所述深度强化学习模型的参数进行更新;将训练完成的定位修正模型部署至服务器云端,根据实时输入的观测量进行定位增强。通过使用本发明,实现月面极区复杂动态环境下的精准卫星月面定位。本发明可广泛应用于月球定位领域。