摘要
本发明公开了一种基于强化学习的放射源搜寻方法,属于核安全技术领域,步骤如下:将辐射场区域划分为若干个区域;选取一个区域并随机生成放射源,且利用智能体在辐射场区域中进行自主寻源训练,得到初始训练好的智能体;重复从剩余没生成过放射源的区域中选取一个区域随机生成放射源,并再次对智能体进行训练更新,得到二次训练好的智能体;将二次训练好的智能体置于随机生成放射源的辐射场区域中进行自主寻源训练,并融合各区域的知识后根据奖励值调整机器人动作,得到全局最优自主寻源策略;根据全局最优自主寻源策略,搜寻辐射场区域中的放射源。本发明解决了难以在复杂环境中快速准确定位放射源的问题。