一种基于LSTM和Q-Learning融合的快速收敛动态诱导频谱接入方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于LSTM和Q-Learning融合的快速收敛动态诱导频谱接入方法
申请号:CN202410795814
申请日期:2024-06-19
公开号:CN118764114A
公开日期:2024-10-11
类型:发明专利
摘要
本发明中提出了一种基于LSTM和Q‑Learning融合的快速收敛动态频谱接入方法,该方法首先采用长短时记忆网络(LSTM)构建认知用户的在线学习模型,根据信道接入的实时ACK消息反馈,将其作为模型输入,得到所有可接入信道的预测占用概率,其次将在线学习模型学到的信道占用预测概率和Q‑Learning强化学习算法的状态动作Q值表相结合,得到新的Q值策略矩阵,认知用户根据该联合策略矩阵进行动态频谱接入,经多次接入迭代后,得到每一种频谱状态条件下的最优频谱接入策略,达到快速收敛到系统最优性能的目的。
技术关键词
频谱接入策略 信道占用概率 信道占用信息 LSTM神经网络 动态频谱接入方法 矩阵 记忆单元 强化学习算法 在线 信道状态信息 误差函数 消息 优化器 因子