一种基于后验和多样性协同任务采样的自适应决策方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于后验和多样性协同任务采样的自适应决策方法
申请号:CN202510289738
申请日期:2025-03-12
公开号:CN120258079A
公开日期:2025-07-04
类型:发明专利
摘要
本发明公开了一种基于后验和多样性协同任务采样的自适应决策方法,本发明的方法包括在每次决策模型的训练中从机器人控制任务分布中采样得到候选训练任务,对于筛选出的每个训练任务利用当前采样策略采样生成训练数据,并利用训练数据对决策模型的参数进行更新;将训练数据输入至任务风险预测模型中以基于编码器‑解码器架构计算近似证据下界ELBO损失,并根据计算得到的ELBO损失函数更新任务风险预测模型的参数;将测试数据输入至更新后的决策模型,并基于更新后的任务风险预测模型反馈的任务风险评估结果优化决策信息,以输出机器人控制任务最终的任务决策结果。本发明在机器人控制的复杂应用场景中,能够有效提升系统的整体性能和适应性。
技术关键词
风险预测模型 机器人控制 贝叶斯准则 生成训练数据 解码器架构 标识符 解码器模型 决策方法 策略 编码器 决策系统 参数 模型训练模块 变量 提升系统 输出模块 动态