摘要
本公开提供一种机器人控制方法、装置和系统,涉及控制领域。机器人控制方法包括:将目标任务拆分为多个子任务;基于物理可达性、时间可达性、多个子任务中每个子任务的紧急度权重、每个子任务与多型异构机器人集合中每个机器人能力的匹配度,在多型异构机器人集合中为目标任务选择候选机器人集合;基于每个子任务的多维度信息和候选机器人集合中每个机器人的多维度信息,构建状态空间向量;基于时间裕度、每个子任务的紧急度权重、每个子任务与候选机器人集合中每个机器人能力的匹配度、和资源效率,构建奖励函数;将状态空间向量输入至强化学习模型,以最大化奖励函数为目标,预测候选机器人集合中每个机器人对每个子任务的动作。