一种基于元强化学习的高光谱开放集领域泛化方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于元强化学习的高光谱开放集领域泛化方法
申请号:CN202411466041
申请日期:2024-10-21
公开号:CN119418171B
公开日期:2025-08-08
类型:发明专利
摘要
本发明属于模式识别技术领域,公开了一种基于元强化学习的高光谱开放集领域泛化方法。首先,为实现稳健的开放集识别策略学习,本发明使用背景像素模拟虚拟未知类,并使用元学习的情景模拟机制对源域中的开放集识别场景进行模拟。在情景模拟过程中,将开放集识别任务建模为内部马尔可夫决策过程,利用强化学习的反馈学习和策略优化机制,迭代优化开集识别策略。其次,为实现源域向未见目标域稳健的跨域知识迁移,本发明将跨任务知识归纳建模为外部马尔可夫决策过程,设计了不变风险奖励机制来鼓励智能体在不同的开放集识别任务中捕获跨任务共享知识。引入了Mamba作为记忆策略网络,利用其强大的上下文压缩能力实现了跨任务共享知识归纳。
技术关键词
强化学习环境 泛化方法 决策 识别策略 状态空间模型 记忆 图像块 网络 模式识别技术 参数 样本 空谱特征 动作策略 轨迹 机制 矩阵 编码器 情景 像素