一种基于谷歌足球模拟器的强化学习方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于谷歌足球模拟器的强化学习方法
申请号:CN202410712405
申请日期:2024-06-04
公开号:CN118278295B
公开日期:2024-08-09
类型:发明专利
摘要
本发明提出了一种基于谷歌足球模拟器的强化学习方法,包括:基于谷歌足球模拟器构建谷歌足球环境,获取当前时刻的观测信息;根据观测信息利用训练好的大语言模型生成动作提示信息;根据动作提示信息,利用智能体从策略网络中选择动作并反馈到所述谷歌足球环境;根据动作执行后谷歌足球环境下的足球比赛视频和动作提示信息,利用训练好的视频文本检索模型计算视频与文本的相似度,进而得到相似度奖励;根据观测信息计算足球基础奖励;根据足球基础奖励和相似度奖励得到强化学习总奖励;根据强化学习总奖励,利用近端策略优化算法更新智能体的策略网络的参数。本发明能够在谷歌足球模拟器模拟的谷歌足球环境中提高强化学习性能。
技术关键词
足球比赛视频 强化学习方法 模拟器 训练样本集 大语言模型 文本编码器 图像编码器 策略 生成动作 注意力机制 视频编码器 微调方法 预训练模型 编码特征 视频帧 前馈神经网络
系统为您推荐了相关专利信息
大语言模型 数据处理方法 数据处理设备 逻辑 深度学习算法
分布式存储系统 大数据 元数据管理模块 策略 动态调整机制
提示方法 融合特征 交叉注意力机制 标签 场景
对象检测模型 特征提取模块 机器学习技术 训练样本集 处理器
视频定位方法 电力 视觉 视频定位系统 关键帧