一种基于过去经验的强化学习机械臂动态避障方法及系统
申请号:CN202510664740
申请日期:2025-05-22
公开号:CN120552049A
公开日期:2025-08-29
类型:发明专利
摘要
本发明涉及一种基于过去经验的强化学习机械臂动态避障方法及系统。首先采用改进SAC算法构建神经网络;随后定义动作空间、状态空间及奖励函数,结合HER算法、经验回放池和课程学习对神经网络进行强化训练,使网络逐步收敛;训练后输出动作控制机械臂,实时检测碰撞与运动误差,依据检测结果动态更新网络参数;通过反复迭代环境交互与参数优化,最终实现机械臂精准避障并抵达目标位置。与现有技术相比,本发明具有灵活度高、适应性强等优点。
技术关键词
动态避障方法
机械臂
课程学习方法
SAC算法
末端执行器
障碍物
动态避障系统
长短期记忆网络
神经网络参数
运动误差
模块
轨迹
关节
动态更新
闭环控制
网络结构