摘要
一种基于改进SAC策略的欠驱动无人艇路径规划方法,涉及船舶运动规划技术领域。本发明是为了解决传统最优控制路径规划方法对环境变化的适应性较差、计算复杂度高,导致实时性差以及实际应用中难以到达理论最优解的问题。本发明利用马尔可夫决策过程模型描述欠驱动无人艇的运动状态,基于所述马尔可夫决策过程模型,分别利用SAC算法和PPO算法求解欠驱动无人艇的动作策略πφ和动作策略πθ;根据欠驱动无人艇与障碍物之间的实时感应距离δ′选择欠驱动无人艇的动作策略,并根据所选择动作策略的回报函数实现欠驱动无人艇的路径规划。