一种多模态强化学习驱动的PM2.5化学组分垂直廓线反演系统及方法

申请号：CN202510589239

申请日期：2025-05-08

公开号：CN120123697B

公开日期：2025-08-26

类型：发明专利

摘要

本发明公开了一种多模态强化学习驱动的PM2.5化学组分垂直廓线反演系统及方法，其中：系统包括深度强化学习模型；深度强化学习模型包括状态空间、Action动作空间、奖励函数、Actor网络和Critic网络；深度强化学习模型用于根据Action动作空间输出的PM2.5各化学组分浓度的垂直廓线预测值与实际监测值间的差异，结合奖励函数，计算当前时刻的奖励值；根据策略评估的评估结果，利用梯度下降方法持续进行策略迭代，直至待深度强化学习模型收敛后，得到最优的目标深度强化学习模型。采用Actor‑Critic网络动态优化策略，结合边缘计算实现分钟级模型更新，解决了传统模型高空盲区、实时性不足等问题。

技术关键词

深度强化学习模型垂直廓线反演系统多模态激光雷达光学网络注意力机制卫星遥感数据地面监测站矩阵策略动态时间规整算法地基激光雷达小波阈值去噪输出模块梯度方法参数模型更新