基于图像时频域增强和动态掩码生成网络的强化学习方法

申请号：CN202511037479

申请日期：2025-07-28

公开号：CN120525747B

公开日期：2025-10-14

类型：发明专利

摘要

本申请公开基于图像时频域增强和动态掩码生成网络的强化学习方法，包括：获取智能体在不同交互环境中的观测状态图像，并送入图像时域‑频域增强模块中，进行图像时频域增强；构造基于空间注意力的图像动态掩码生成网络，对增强后的图像进行动态掩码加权处理，去除图像中与智能体预设任务无关的干扰信息；在AC框架强化学习网络中，将经过动态掩码加权处理后的图像送入强化学习网络中，预测智能体的执行动作；以在交互环境中获取最高分数为目标，对智能体的执行动作进行实时调整，直到完成预设任务。本发明所提出方法能精确捕捉到与任务最相关图像像素，提升样本利用效率，增强模型的泛化能力，提升强化学习算法的训练效果。

技术关键词

强化学习方法强化学习网络强化学习框架动态注意力状态图像数据强化学习算法网络结构机械手指生成动作融合策略图像像素三通道模块序列尺寸元素

系统为您推荐了相关专利信息

一种无人机装备资源优化配置方法及系统

资源优化配置方法装备运输无人机粒子群算法求解计算机程序指令

一种基于结构化视距场的动态遮挡剔除方法和系统

遮挡剔除方法网格数据管理单元射线三维极坐标系统

一种遥感影像多源异构数据融合处理方法及系统

多源异构数据融合局部特征信息遥感影像数据图像局部特征语义

基于模拟退火的梁式贴片机表面贴装过程优化方法

周期贴片机设备存储设备更换吸嘴动态温度调节

一种基于大语言模型的行业报告自动生成系统

自动生成系统大语言模型报告企业金融风险评估技术