基于WMSRL模型的机器人避障方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于WMSRL模型的机器人避障方法
申请号:CN202410790268
申请日期:2024-06-19
公开号:CN118625809B
公开日期:2025-09-09
类型:发明专利
摘要
本发明公开了一种基于WMSRL模型的机器人避障方法,WMSRL模型运行在机器人运动协调控制模块中。所述WMSRL模型包括有两部分内容,一部分是在机器人安全探索过程中采用安全强化学习手段,另一部分是应用改进的世界模型进行机器人位姿信息的策略学习。经本发明避障方法处理后的机器人动作轨迹会在世界模型中模拟执行,从而预测机器人每个时刻状态对应的奖励、代价、奖励回报值和代价回报值。本发明采用无模型的安全强化学习方法与改进的世界模型相结合,这种结合旨在提高对位姿信息利用率,从而更快地促进可行域内的策略收敛,并通过在世界模型中使用在线规划以实现训练和探索过程中代价的最小化。
技术关键词
机器人避障方法 解码器 机器人运动轨迹 策略 稳态 机器人运动规划 强化学习模型 机器人位姿 编码器 协调控制模块 拉格朗日方法 MPC算法 转移概率矩阵 序列 增广拉格朗日 修正机器人