一种多模态强化学习驱动的PM2.5化学组分垂直廓线反演系统及方法
申请号:CN202510589239
申请日期:2025-05-08
公开号:CN120123697B
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开了一种多模态强化学习驱动的PM2.5化学组分垂直廓线反演系统及方法,其中:系统包括深度强化学习模型;深度强化学习模型包括状态空间、Action动作空间、奖励函数、Actor网络和Critic网络;深度强化学习模型用于根据Action动作空间输出的PM2.5各化学组分浓度的垂直廓线预测值与实际监测值间的差异,结合奖励函数,计算当前时刻的奖励值;根据策略评估的评估结果,利用梯度下降方法持续进行策略迭代,直至待深度强化学习模型收敛后,得到最优的目标深度强化学习模型。采用Actor‑Critic网络动态优化策略,结合边缘计算实现分钟级模型更新,解决了传统模型高空盲区、实时性不足等问题。
技术关键词
深度强化学习模型
垂直廓线
反演系统
多模态
激光雷达光学
网络
注意力机制
卫星遥感数据
地面监测站
矩阵
策略
动态时间规整算法
地基激光雷达
小波阈值去噪
输出模块
梯度方法
参数
模型更新