摘要
本发明公开了未知障碍物环境下无人机路径规划方法及系统,具体涉及无人机自主导航与路径规划技术领域,根据无人机机载传感器获取的探测范围内障碍物距离分布信息及无人机状态参数,构建包含相对目标位置、速度、姿态角、角速度及障碍物的观测空间;设计包含总升力、滚转力矩、俯仰力矩和偏航力矩的连续动作空间;构建融合任务结束奖励、距离目标奖励、前进效率奖励及避障安全奖励的多维度奖励函数,引导智能体优化路径;基于观测空间与奖励反馈,通过SAC算法中自适应熵正则化平衡策略探索与开发,不断优化智能体控制策略,实现无碰撞、短路径的实时路径规划。