摘要
本发明公开了一种基于分层强化学习的水下拓扑控制与信道选择方法。首先在目标水域布设传感器节点并组网,建立分层网络的联合状态空间;其次,上层将拓扑子图构建转化为连续动作控制问题,通过深度确定性策略梯度为网络链路分配连通权重,得到初始拓扑子图;随后,使用最小连通补边机制,在初始拓扑子图的基础上构建可行拓扑子图,实现网络拓扑控制;最后,下层对可行拓扑子图中输出的每条链路,使用Q学习进行信道模式选择。本发明能够实现拓扑控制与信道选择的协同优化,在保证网络连通性的同时提升拓扑控制的效应,并为每条链路选择最优的信道模式。