摘要
本发明公开一种基于图强化学习的车联网信息年龄优化方法及系统,首先构建车辆状态的批次建模与有限缓冲队列结构,将感知数据建模为多数据包批次并进行队列管理;利用图神经网络对V2V链路拓扑建模,提取反映拓扑结构的大尺度信道嵌入表示;构建基于集中训练分布式执行框架的多智能体强化学习系统,各智能体根据包含图嵌入特征的局部状态进行决策,输出混合动作空间,以接收端AoI相反数作为奖励;引入基于优势函数的图嵌入监督机制,使拓扑特征与长期优化目标对齐;通过多轮训练更新网络参数,最终实现各智能体对丢包与功率的自主优化控制。本发明能够有效协调数据包队列管理与无线资源分配,在复杂动态拓扑环境下实现高效、低开销的AoI最小化。