摘要
本发明公开了一种涉诈网站识别方法、系统、设备及介质,采集欺诈网站数据集和良性网站数据集;构建涉诈网站识别模型,包括网页类别识别模块、第一涉诈识别模块和第二涉诈识别模块;网页类别识别模块识别网页信息的网页类别,包括单元素网页和非单元素网页;第一涉诈识别模块识别非单元素网页;第二涉诈识别模块识别单元素网页;基于欺诈网站数据集和良性网站数据集对涉诈网站识别模型进行训练;涉诈网站检测过程中,将待检测网页信息输入训练完成的涉诈网站识别模型,得到属性信息以判断是否为涉诈网站。本发明提供的方法,针对不同类型的涉诈网站,构建不同的识别模块,应对涉诈网站的多样化,以及频繁更换网址或页面的情况,提高识别的准确性。