摘要
本发明公开了一种基于后验和多样性协同任务采样的自适应决策方法,本发明的方法包括在每次决策模型的训练中从机器人控制任务分布中采样得到候选训练任务,对于筛选出的每个训练任务利用当前采样策略采样生成训练数据,并利用训练数据对决策模型的参数进行更新;将训练数据输入至任务风险预测模型中以基于编码器‑解码器架构计算近似证据下界ELBO损失,并根据计算得到的ELBO损失函数更新任务风险预测模型的参数;将测试数据输入至更新后的决策模型,并基于更新后的任务风险预测模型反馈的任务风险评估结果优化决策信息,以输出机器人控制任务最终的任务决策结果。本发明在机器人控制的复杂应用场景中,能够有效提升系统的整体性能和适应性。