摘要
本发明提供了一种人机混驾环境下的交通控制方法、装置及路侧设备,属于交通控制技术领域,其方法包括:获取交叉口处的多个控制线以及需通过控制线的车辆队列,并构建与所述多个控制线一一对应的多个智能体,车辆队列为人工驾驶车辆和自动驾驶车辆的混合队列;对构建的多个智能体的近端策略优化模型进行训练,获得目标策略网络;基于目标策略网络确定车辆队列的控制参数,控制参数包括车辆队列通过控制线的目标车道、目标速度和目标加速度;控制人工驾驶车辆按照目标车道行驶,并控制自动驾驶车辆按照目标车道、目标速度和目标加速度行驶。本发明能够在动态复杂的交通环境中确保交通控制性能,提高了交通控制方法的灵活性、合理性和可靠性。