摘要
本发明提供一种智慧物流车优化控制模型的生成方法、装置及存储介质,属于自动驾驶技术领域,该方法包括:基于仿真环境中物流车的动态信息和风险信息训练深度确定性策略梯度算法模型,得到初步训练模型;将实际环境中物流车的动态信息和风险信息作为所述初步训练模型的输入,并将物流车控制指令作为所述初步训练模型的输出,对所述初步训练模型进行再次训练,且基于物流车控制指令调整对物流车的动态,并根据物流车反馈的动态信息优化所述初步训练模型,得到物流车优化控制模型;物流车优化控制模型用于基于物流车所在环境中的动态信息和风险信息,生成物流车的控制指令。本发明可解决物流车控制方法难以满足物流车高效、安全运行需求的问题。