基于平均奖励强化学习的机械臂装配方法及系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
验证码登录
×
发送
登录即代表您已同意AITNT
用户协议
和
隐私政策
登录
登录成功后会自动刷新界面
AITNT公众号
AITNT APP
AITNT交流群
搜索
未登录
首页
AI中心
退出
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI 源力市场
寻求报道
基于平均奖励强化学习的机械臂装配方法及系统
申请号:
CN202511297431
申请日期:
2025-09-11
公开号:
CN121018563A
公开日期:
2025-11-28
类型:
发明专利
摘要
本发明涉及基于平均奖励强化学习的机械臂装配方法及系统。其中的方法包括:采集装配任务执行过程中的当前状态信息,并通过基于扩散模型的模仿学习策略生成动作分块序列;以所述当前状态信息和所述动作分块序列作为输入,采用基于APO算法的残差强化学习策略,对所述动作分块序列进行实时微调,以生成机械臂实际执行动作;通过闭环控制,实时反馈和调整,以使机械臂完成长视距的复杂装配任务。本发明可提升长视距复杂装配任务的完成率和效率。
技术关键词
强化学习策略
机械臂
序列
计算机装置
生成动作
噪声
闭环控制
分块技术
矩阵
可读存储介质
算法
装配系统
误差
轨迹
元素
参数
数据
时序
网络