摘要
本发明涉及车联网技术领域,公开一种基于知识协作的通信资源分配方法、系统、设备和介质,方法包括:基于自动驾驶车辆的局部高维观测信息,利用隐马尔可夫模型抽象获取低维隐状态,将隐状态上传至公共知识库;在公共知识库中,采用自注意力机制对来自若干车辆的隐状态进行加权聚合,生成全局环境的聚合隐状态表示;根据全局隐状态,提取并定义代表通信资源最优分配策略的动作约束,包括基准带宽分配比率及其上下限;将动作约束作为知识输入,应用于深度强化学习代理的带宽资源分配决策中,通过带有动作空间约束的Actor‑评论家结构,实现资源的动态合理分配;通过深度强化学习代理在以动作约束为指导,进行训练和决策,获得带宽分配策略。