一种基于深度强化学习的无人机通信系统策略优化方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于深度强化学习的无人机通信系统策略优化方法
申请号:CN202411681837
申请日期:2024-11-21
公开号:CN119652389A
公开日期:2025-03-18
类型:发明专利
摘要
一种基于深度强化学习的无人机通信系统策略优化方法,建立无人机通信系统模型,包括一个无人机、RIS以及多个地面接收用户,在给出特定的信道状态信息(CSI)情况下,利用深度强化学习(DRL)技术,通过改进的TD3算法improvement‑TD3对最大化速率C进行优化,求得最优的波束成形矩阵和相移矩阵。本发明在现有的TD3算法中引入了熵正则化,以增强探索性,促使智能体更多地探索环境,平衡探索与利用之间的关系,最终获得最优的发射波束成形矩阵和RIS相移,避免陷入局部最优解,提高学习的鲁棒性和泛化能力。
技术关键词
无人机通信系统 策略优化方法 深度强化学习 波束成形矩阵 确定性策略梯度 网络 接收端 梯度下降算法 概率密度函数 信道状态信息 检验系统 速率 反射单元 噪声 反射面
系统为您推荐了相关专利信息
任务分配方法 深度确定性策略梯度 移动小车 无线充电 车载服务器
智能采集方法 计算方法 深度强化学习模型 传感器节点 数据采集频率
气流发生器 障碍物 规划 生成无人机 深度强化学习技术
深度强化学习模型 配电网调度方法 拓扑结构信息 状态监测数据 分区
超大规模 波束成形矩阵 定位方法 信道 笛卡尔