摘要
本发明涉及汽车动力学控制技术领域,尤其涉及一种结合确定性经验追踪的智能悬架控制方法、介质及设备,方法包括对两个评价网络和控制策略网络进行预训练;使用预训练得到的初始控制策略模型根据车辆的第一状态,确定智能悬架输出的第一控制力;将第一控制力作用于车辆,得到车辆的下一第一状态;根据第一控制力以及第一状态,确定第一奖励和辅助奖励组,得到第二样本;利用多组第二样本对预训练得到的两个初始评价模型和初始控制策略模型再次进行训练;在训练的过程中向第一控制力添加扰动量,对应得到训练后的两个最终评价模型和最终控制策略模型。本发明有效解决现有技术中样本利用效率低、数据稳定性差以及高价值数据难以挖掘等问题。