置信域策略优化模型的训练方法、装置、计算机设备、可读存储介质和程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
置信域策略优化模型的训练方法、装置、计算机设备、可读存储介质和程序产品
申请号:CN202410840301
申请日期:2024-06-26
公开号:CN118569731A
公开日期:2024-08-30
类型:发明专利
摘要
本申请涉及一种置信域策略优化模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:建立汽车系统模型;构建待训练的置信域策略优化模型,所述待训练的置信域策略优化模型包括策略网络和评价网络;基于所述汽车系统模型和所述策略网络,获取标准工况训练集;基于所述标准工况训练集对所述策略网络和所述评价网络进行训练,得到训练完成的置信域策略优化模型,所述训练完成的置信域策略优化模型用于对汽车进行能量管理。提升了整车性能。
技术关键词
策略优化模型 网络 发动机 训练集 能量管理 工况 汽车 样本 计算机设备 参数 计算机程序产品 可读存储介质 处理器 训练装置 模块 存储器 加速度 邻域