摘要
本发明涉及人工智能领域,提供了一种动作校正方法、装置、设备及介质,可应用于金融、医疗领域的机器人,其方法包括:获取任务描述和观察数据;基于运动预测策略对任务描述和观察数据进行预测处理得到初始动作指令;在初始动作指令中的每个动作指令执行后,根据运动评估策略对每个动作指令进行评估处理得到评估结果;当评估结果是执行失败时,基于动作调整策略对每个动作指令进行调整处理得到中间动作指令;基于动作校正策略对中间动作指令进行校正处理得到目标动作序列。通过实施本发明实施例实现了对任务描述和观察数据进行预测、评估、调整和校正处理得到目标动作序列,以提高在动态复杂环境中的自主决策和持续优化能力,从而提高处理效率。