摘要
本发明提供一种基于多智能体深度强化学习的双阶段协同优化方法,在大模型协同微调阶段,车辆将采集的环境信息传输至所属的无人机进行大模型微调;车辆发出的请求根据雷达感知信息估计率的优先级进行排队处理;在大模型协同推理阶段,无人机将地面车辆用户根据不同的服务请求进行分类处理;无人机与其所属类别的车辆进行共享推理任务;并且在两个阶段分别通过MADDPG算法调整自身的发射功率来优化车辆通信速率、以及通过MAPPO算法优化无人机之间的位移和资源分配,并最大化下行链路的通信速率。本发明通过多智能体协作,优化大规模模型的微调与推理过程,提升车联网系统中通信和感知效率,同时提高车辆用户的AIGC服务满意度。