一种人工智能主体深度强化学习不确定性估计方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种人工智能主体深度强化学习不确定性估计方法
申请号:
CN202411673370
申请日期:
2024-11-21
公开号:
CN119886269A
公开日期:
2025-04-25
类型:
发明专利
摘要
一种人工智能主体深度强化学习不确定性估计方法,主要包括以下步骤:将基于深度强化学习的决策不确定性分解为偶然不确定性和认知不确定性;基于贝叶斯和非贝叶斯方法,计算每个不确定度的基本分量;合成获得标准不确定度以及扩展。该方法突破了传统深度强化学习不确定性估计的建模方法,以贝叶斯和非贝叶斯的方式评估不确定度,能够有效减少人工智能主体深度强化学习探索‑利用所需的时间。
技术关键词
不确定性估计方法
深度强化学习算法
优化神经网络
样本
深度强化学习模型
灰色关联理论
损失函数设计
贝叶斯方法
训练神经网络
方差信息
加权方法
数据噪声
决策
建模方法
标签
系统为您推荐了相关专利信息
1
一种容器镜像已安装软件识别方法及装置
镜像
软件识别方法
数据
样本
命令
2
基于多模态融合的无人机吊运负载状态预测方法及系统
飞行状态数据
状态预测方法
多模态
无人机
变量
3
一种面向样本库的设备标准化管理方法及系统
标准化管理方法
库设备
样本
环境传感器
增设单元
4
一种基于多模态数据融合的苹果产地识别方法
产地识别方法
多模态数据融合
级联分类器
激光诱导击穿光谱
遗传算法优化
5
考虑云量和气溶胶的度电成本计算方法、系统及存储介质
气溶胶光学厚度
热电站
覆盖率
模糊算法
历史数据统计