摘要
本发明公开了一种基于深度强化学习的网站敏感信息检测方法及装置,包括:步骤一、获取待检测网站的真实数据;步骤二、提取真实网站文本数据中待检测的数据,得到候选信息集;步骤三、对候选信息集进行特征提取,生成待检测候选信息集的特征向量;步骤四、将待检测候选信息集的特征向量输入至深度强化学习模型中,判断待检测候选信息集是否含有敏感信息。本发明具有精准预测网站信息所属的敏感信息分类标签的有益效果。本方法还公开了一种基于机器学习的网站敏感信息检测装置,包括:网站数据获取模块,特征提取模块,敏感信息检测模块。本发明使用基于深度强化学习的方法来解决网络中敏感信息与常规信息的分类问题,能够快速有效地发现网站中是否存在敏感信息,从而供相关工作人员及时做出应对措施,避免泄露敏感信息,保证数据安全。