摘要
本发明属于模式识别技术领域,公开了一种基于元强化学习的高光谱开放集领域泛化方法。首先,为实现稳健的开放集识别策略学习,本发明使用背景像素模拟虚拟未知类,并使用元学习的情景模拟机制对源域中的开放集识别场景进行模拟。在情景模拟过程中,将开放集识别任务建模为内部马尔可夫决策过程,利用强化学习的反馈学习和策略优化机制,迭代优化开集识别策略。其次,为实现源域向未见目标域稳健的跨域知识迁移,本发明将跨任务知识归纳建模为外部马尔可夫决策过程,设计了不变风险奖励机制来鼓励智能体在不同的开放集识别任务中捕获跨任务共享知识。引入了Mamba作为记忆策略网络,利用其强大的上下文压缩能力实现了跨任务共享知识归纳。