摘要
本发明公开了一种基于强化学习的手机装配上料方法、系统与装置,该方法包括:利用传感模块采集机械臂在执行上料任务过程中的状态数据;其中,状态数据,包括环境状态信息和自身的动作状态;根据预设的奖励函数并使用强化学习算法对所述状态数据进行学习以训练强化学习上料策略模型,并基于训练好的强化学习上料策略模型生成最优动作策略;利用PLC系统对最优动作策略进行指令解析,以根据解析的指令控制机械臂的电机和相关执行元件按照所述最优动作策略进行控制操作。本发明旨在解决现有的手机装配上料过程中存在的多个问题,特别是如何提高上料操作的精确度和效率,并且增加上料的灵活性和适应性以及智能化程度。