摘要
本发明公开了一种网站篡改的智能识别方法,所述方法包括以下步骤:S1:网站数据收集,通过计算机系统对目标网站的各级页面源码数据进行全量实时采集,采集深度可配置;S2:网站数据预处理,对采集的数据进行隐私保护和脱敏处理,并将处理后的数据发送至消息队列进行解耦缓存;S3:网站数据特征提取,从预处理后的数据中提取用于识别网站内容异常变化的关键特征;S4:网站篡改智能识别,使用训练好的支持向量机模型对提取的特征进行分类,识别网站是否被篡改,其中所述支持向量机模型通过最大化分类间隔来构建决策函数。依赖支持向量机算法进行检测,快速响应网站篡改问题;检测过程自我优化、自我学习,提高网站动态变化的适应能力。