基于Mamba编码完整历史的机器人时序模仿学习方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于Mamba编码完整历史的机器人时序模仿学习方法及系统
申请号:CN202510881497
申请日期:2025-06-27
公开号:CN120791743A
公开日期:2025-10-17
类型:发明专利
摘要
本发明属于人工智能相关技术领域,其公开了一种基于Mamba编码完整历史的机器人时序模仿学习方法及系统,方法包括:接收机器人执行任务过程中的多模态观测序列,多模态观测序列包括至少一种传感器的观测数据;利用基于状态空间模型的序列处理模块处理多模态观测序列,在每个时间步更新一个编码截至当前时间步的完整历史信息的时序输出;基于当前时间步的时序输出,预测机器人下一步或未来一系列的动作,进而控制机器人进行模仿。本发明利用基于状态空间模型的时序处理模块来处理和编码机器人任务执行过程中的完整观测历史,以实现非马尔可夫决策的模仿学习方法,提升了机器人在复杂、状态依赖的长时序操作任务中的学习效率和执行成功率。
技术关键词
模仿学习方法 时序 状态空间模型 多模态 预测机器人 序列 数据编码器 视觉特征 模块 视觉传感器 学习系统 矩阵 存储器 策略 处理器