置信域策略优化模型的训练方法、装置、计算机设备、可读存储介质和程序产品
申请号:CN202410840301
申请日期:2024-06-26
公开号:CN118569731A
公开日期:2024-08-30
类型:发明专利
摘要
本申请涉及一种置信域策略优化模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:建立汽车系统模型;构建待训练的置信域策略优化模型,所述待训练的置信域策略优化模型包括策略网络和评价网络;基于所述汽车系统模型和所述策略网络,获取标准工况训练集;基于所述标准工况训练集对所述策略网络和所述评价网络进行训练,得到训练完成的置信域策略优化模型,所述训练完成的置信域策略优化模型用于对汽车进行能量管理。提升了整车性能。
技术关键词
策略优化模型
网络
发动机
训练集
能量管理
工况
汽车
样本
计算机设备
参数
计算机程序产品
可读存储介质
处理器
训练装置
模块
存储器
加速度
邻域