摘要
本申请涉及机器人技术领域,公开了一种用于机器人的任务规划方法、装置、设备及介质,其中方法包括:建立包含环境空间拓扑及对象属性的场景关系图模型;将接收的自然语言指令输入第一语言模型,输出结构化任务目标;基于结构化任务目标和实时环境感知数据,通过第二语言模型生成辅助信息,并更新场景关系图模型;将更新后的场景关系图模型输入强化学习模型,输出动作决策序列;控制目标机器人执行动作决策序列,并根据环境反馈信息调整场景关系图模型和强化学习模型的强化学习策略。本申请能够实现机器人在复杂动态场景中高效、灵活且精准的任务规划,提高机器人任务规划的效率与适应性。