摘要
提供了利用机器学习模型来管理机器人的状态的方法、装置、设备和介质。在一种方法中,接收描述机器人在第一时间点的第一状态的第一图像。接收动作图像,动作图像指定由机器人在第一时间点之后的第二时间点执行的动作,动作以机器人的骨架图像来表示。利用机器学习模型,基于第一图像和动作图像,确定机器人在第二时间点的第二状态的第二图像。利用本公开的实现方式,提出使用骨架图像来作为一种精确的动作编码,在高自由度动作场景下可以以统一方式来表示具有不同结构的机器人的动作。以此方式,可以利用骨架图像的动作编码作为机器学习模型的控制条件,进而为具有高自由度的机器人交互提供更为准确的预测模型。