摘要
本申请适用于自主驾驶技术领域,提供了一种车辆的驾驶策略模型的训练方法,包括:获取多个车辆的驾驶策略样本数据的融合特征、全局驾驶策略模型的当前迭代次数和当前模型参数,驾驶策略样本数据的融合特征是通过全局驾驶策略模型对驾驶策略样本数据提取残差特征和累积特征后融合得到的,根据当前迭代次数确定全局驾驶策略模型的当前更新方式,当前更新方式包括本地梯度更新和全局聚合更新,基于当前更新方式,根据每个车辆的驾驶策略样本数据和全局驾驶策略模型的当前模型参数对该车辆的驾驶策略模型进行更新,得到该车辆更新后的驾驶策略模型。通过本发明可以解决通过现有的联邦学习方法训练驾驶策略模型导致的训练时间较长、效率较低的问题。