基于门控循环单元的机器人强化学习控制方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于门控循环单元的机器人强化学习控制方法及系统
申请号:CN202411687998
申请日期:2024-11-25
公开号:CN119536333A
公开日期:2025-02-28
类型:发明专利
摘要
本发明公开了基于门控循环单元的机器人强化学习控制方法及系统,涉及人工智能技术领域,基于强化学习状态机,将已训练完的学生网络零映射部署到真实四足机器人上,实现四足机器人运动控制;学生网络的训练过程如下:搭建机器人的仿真训练地形环境,为每种地形设置不同等级的地形难度;基于蒸馏学习思想,搭建基于门控循环单元的教师网络和学生网络,并构建总损失函数,基于构建的总损失函数,通过全方位的仿真训练地形环境和大规模并行训练方法,学生网络拟合教师网络输出的电机关节角度;该机器人强化学习控制方法及系统的实现机器人在非结构化地形下的鲁棒运动,对传统控制无法胜任的动态环境具有很好的抗干扰能力和自恢复能力。
技术关键词
强化学习控制方法 门控循环单元 多层感知器 四足机器人 网络 学生 并行训练方法 关节 教师 编码器 状态机 机器人运动控制 学习控制系统 机器人基坐标系 策略 嵌入式平台 评估电机