摘要
本申请公开了一种网页黑链预防方法、装置、设备及存储介质,通过流量探针获取真实流量中的有效链接,能够补充传统基于爬虫的监测方法可能未覆盖到的链接,从而提高监测的准确性和完整性,通过建立第三方供应链接的管理台账,并定期检测链接有效性,避免黑链内容被传播,减少用户受到的风险和损失,引入机器学习技术,自动学习并更新关键词黑名单,解决传统黑名单滞后的问题,解决了目前的方案有着极大的局限性,商用软件注重普适性,爬虫策略和关键词黑名单更新时效和对特定领域的适配程度不够导致的出现漏洞,且发生挂黑链行为后才可能发现,处置只能发生在事后阶段,较为滞后的技术问题。