一种基于深度强化学习的无人机通信系统策略优化方法

申请号：CN202411681837

申请日期：2024-11-21

公开号：CN119652389A

公开日期：2025-03-18

类型：发明专利

摘要

一种基于深度强化学习的无人机通信系统策略优化方法，建立无人机通信系统模型，包括一个无人机、RIS以及多个地面接收用户，在给出特定的信道状态信息（CSI）情况下，利用深度强化学习（DRL）技术，通过改进的TD3算法improvement‑TD3对最大化速率C进行优化，求得最优的波束成形矩阵和相移矩阵。本发明在现有的TD3算法中引入了熵正则化，以增强探索性，促使智能体更多地探索环境，平衡探索与利用之间的关系，最终获得最优的发射波束成形矩阵和RIS相移，避免陷入局部最优解，提高学习的鲁棒性和泛化能力。

技术关键词

无人机通信系统策略优化方法深度强化学习波束成形矩阵确定性策略梯度网络接收端梯度下降算法概率密度函数信道状态信息检验系统速率反射单元噪声反射面

系统为您推荐了相关专利信息

面向定向无线供能辅助移动边缘计算的智能任务分配方法

任务分配方法深度确定性策略梯度移动小车无线充电车载服务器

一种无线传感器网络数据智能采集方法及系统

智能采集方法计算方法深度强化学习模型传感器节点数据采集频率

基于深度强化学习的无人机避障控制方法及系统

气流发生器障碍物规划生成无人机深度强化学习技术

一种基于深度强化学习的配电网调度方法及系统

深度强化学习模型配电网调度方法拓扑结构信息状态监测数据分区

面向U6G FDD超大规模MIMO的下行信道重建与用户定位方法

超大规模波束成形矩阵定位方法信道笛卡尔