一种基于验证反馈的大模型强化学习网络配置生成方法

申请号：CN202510463855

申请日期：2025-04-14

公开号：CN120525019A

公开日期：2025-08-22

类型：发明专利

摘要

本发明公开了一种基于验证反馈的大模型强化学习网络配置生成方法，通过网络配置语义解析将输入的网络现象和状态内容转化为语义和动作序列，基于语义动作序列，通过混合动作空间策略生成和神经符号协同的强化学习模型生成符合要求的配置框架与参数，将生成的网络配置信息在数字孪生系统中进行验证与反馈，在虚拟环境中通过形式化验证与性能仿真，模拟真实网络场景，全面评估配置的正确性与性能表现，进而生成包含多维度信息的反馈信号，依据数字孪生验证对策略模型进行修正和优化，最后通过奖励机制来引导智能体对高熵配置项进行调整，优化配置生成大模型。

技术关键词

配置生成方法强化学习网络数字孪生系统策略强化学习算法符号面向通信网络动态知识图谱网络配置信息强化学习方法强化学习模型模糊语义噪声数据节点特征模型更新动态更新