一种有模型深度强化学习方法、装置、设备及介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种有模型深度强化学习方法、装置、设备及介质
申请号:
CN202510781912
申请日期:
2025-06-12
公开号:
CN120893505A
公开日期:
2025-11-04
类型:
发明专利
摘要
本发明涉及模型训练技术领域,具体是涉及一种有模型深度强化学习方法、装置、设备及介质。本发明基于智能体工作的原始环境图像分析出差异图像,该差异图像代表了环境的动态变化信息,然后基于该差异图像和原始环境图像训练世界模型,使得世界模型能够学习到复杂变化的环境。最后使用经过学习而形成的已训练世界模型为智能模型的训练提供模拟环境。由于世界模型具备生成动态变化的复杂虚拟环境能力,因此智能体的智能模型在世界模型提供的模拟环境进行学习,能够学习到应对复杂变化环境的措施。
技术关键词
深度强化学习方法
智能模型
随机编码器
变量
动态
掩码矩阵
模型训练技术
标志
调制器
模型训练模块
机器人
图像处理模块
可读存储介质
终端设备
解码器
处理器
序列
系统为您推荐了相关专利信息
1
一种间歇性窃电用户辨识方法及系统
窃电嫌疑
窃电用户辨识方法
皮尔逊相关系数
有功功率
电表
2
一种基于圆轨迹控制障碍函数的移动机器人路径规划方法和系统
障碍物
路径跟踪控制器
轨迹参数
控制移动机器人
二次规划方法
3
一种基于极性多脉冲神经元的脉冲神经网络单时间步转换方法
人工神经网络结构
转换方法
脉冲神经网络模型
智能边缘设备
信息熵
4
游戏编辑方法、游戏编辑装置、程序产品与电子设备
编程
图形化用户界面
虚拟对象
图形用户界面
生成指令
5
一种用于超高反射率Mini LED印制电路板的优化方法
超高反射率
印制电路板
短距离
模糊推理
高密度