摘要
本发明涉及机器人技术领域,提供一种任务卸载方法及装置,应用于机器人任务卸载决策系统中,系统包括:多个机器人、多个无线接入点及云服务器,通过针对多个机器人、多个无线接入点以及云服务器的任务卸载问题,根据时间延迟以及能量消耗,构建目标优化问题函数。将目标优化问题函数建模为马尔可夫决策过程。利用双重评论家近端策略优化算法训练初始任务卸载决策生成模型,以求解马尔可夫决策过程,得到训练好的任务卸载决策生成模型,通过训练好的任务卸载决策生成模型获取机器人的目标任务卸载决策,任务卸载决策生成模型由策略网络和双价值网络组成,目标任务卸载决策为卸载完全任务决策、卸载部分任务决策以及不卸载任务决策中的一种。