一种基于元强化学习的高光谱开放集领域泛化方法

申请号：CN202411466041

申请日期：2024-10-21

公开号：CN119418171B

公开日期：2025-08-08

类型：发明专利

摘要

本发明属于模式识别技术领域，公开了一种基于元强化学习的高光谱开放集领域泛化方法。首先，为实现稳健的开放集识别策略学习，本发明使用背景像素模拟虚拟未知类，并使用元学习的情景模拟机制对源域中的开放集识别场景进行模拟。在情景模拟过程中，将开放集识别任务建模为内部马尔可夫决策过程，利用强化学习的反馈学习和策略优化机制，迭代优化开集识别策略。其次，为实现源域向未见目标域稳健的跨域知识迁移，本发明将跨任务知识归纳建模为外部马尔可夫决策过程，设计了不变风险奖励机制来鼓励智能体在不同的开放集识别任务中捕获跨任务共享知识。引入了Mamba作为记忆策略网络，利用其强大的上下文压缩能力实现了跨任务共享知识归纳。

技术关键词

强化学习环境泛化方法决策识别策略状态空间模型记忆图像块网络模式识别技术参数样本空谱特征动作策略轨迹机制矩阵编码器情景像素