一种基于多智能体深度强化学习的双阶段协同优化方法

申请号：CN202510085471

申请日期：2025-01-20

公开号：CN119922575B

公开日期：2025-10-14

类型：发明专利

摘要

本发明提供一种基于多智能体深度强化学习的双阶段协同优化方法，在大模型协同微调阶段，车辆将采集的环境信息传输至所属的无人机进行大模型微调；车辆发出的请求根据雷达感知信息估计率的优先级进行排队处理；在大模型协同推理阶段，无人机将地面车辆用户根据不同的服务请求进行分类处理；无人机与其所属类别的车辆进行共享推理任务；并且在两个阶段分别通过MADDPG算法调整自身的发射功率来优化车辆通信速率、以及通过MAPPO算法优化无人机之间的位移和资源分配，并最大化下行链路的通信速率。本发明通过多智能体协作，优化大规模模型的微调与推理过程，提升车联网系统中通信和感知效率，同时提高车辆用户的AIGC服务满意度。

技术关键词

多智能体深度强化学习协同优化方法阶段网络建立通信速率控制无人机悬停预测雷达回波资源分配地面车辆图像策略更新多智能体协作设计约束条件参数算法链路