一种基于多智能体深度强化学习的双阶段协同优化方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多智能体深度强化学习的双阶段协同优化方法
申请号:CN202510085471
申请日期:2025-01-20
公开号:CN119922575B
公开日期:2025-10-14
类型:发明专利
摘要
本发明提供一种基于多智能体深度强化学习的双阶段协同优化方法,在大模型协同微调阶段,车辆将采集的环境信息传输至所属的无人机进行大模型微调;车辆发出的请求根据雷达感知信息估计率的优先级进行排队处理;在大模型协同推理阶段,无人机将地面车辆用户根据不同的服务请求进行分类处理;无人机与其所属类别的车辆进行共享推理任务;并且在两个阶段分别通过MADDPG算法调整自身的发射功率来优化车辆通信速率、以及通过MAPPO算法优化无人机之间的位移和资源分配,并最大化下行链路的通信速率。本发明通过多智能体协作,优化大规模模型的微调与推理过程,提升车联网系统中通信和感知效率,同时提高车辆用户的AIGC服务满意度。
技术关键词
多智能体深度强化学习 协同优化方法 阶段 网络 建立通信 速率 控制无人机悬停 预测雷达回波 资源分配 地面车辆 图像 策略更新 多智能体协作 设计约束条件 参数 算法 链路