一种基于强化学习的视觉-语言-动作模型的恢复方法

申请号：CN202511178417

申请日期：2025-08-21

公开号：CN120911618A

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了一种基于强化学习的视觉‑语言‑动作模型的恢复方法，涉及机器人学习领域，本方法针对视觉‑语言‑动作模型，即VLA模型，在资源受限的低算力设备上的部署问题，提出一种三阶段方法，首先对VLA模型应用结构化剪枝，紧接着采用一个性能恢复阶段，结合监督微调SFT与强化学习RL，以恢复模型在下游任务上的有效性，最后进行量化调整，以进一步优化模型的精度和效率。本方法使得机器人端资源受限的设备上也能正常运行VLA模型，推动了VLA这一技术的落地应用。

技术关键词

恢复方法视觉有效性阶段受限机器人参数资源解码器中间层精度内存决策策略标记代表算法动态框架通道