摘要
本发明公开了一种基于动态窗口法引导的TD3无地图导航方法,具体涉及路径规划技术领域,获取机器人当前状态信息和目标位置;将当前状态信息和目标位置信息经过预处理后,输入达到改进TD3网络中,得到TD3输出动作,并结合改进评价函数与逃离机制获取改进DWA输出动作,将获取的两个动作输入到动作选择器输出最优动作;机器人执行最优动作,完成无地图导航任务。本发明通过对TD3网络结构进行改进,融合DWA(动态窗口法)与LSTM(长短期记忆网络)应用于无地图导航,该网络结构可以根据输入的目标点相对位置和机器人状态直接输出机器人动作即线速度与角速度,实现端到端的无地图导航。