摘要
本公开涉及招标信息筛选领域,公开了一种招标信息筛选方法、系统、设备及存储介质,所述方法包括通过爬虫程序获取目标网站的网页信息;基于预设的网页结构识别规则库,从所述目标网站的网页信息中自动识别网页中招标信息所在的结构化数据区域;从所述招标信息所在的结构化数据区域中提取招标信息;对提取的所述招标信息进行多维度去重处理,得到去重后招标信息;对所述去重后招标信息进行自动化分类处理,得到标注类别的招标信息;对所述标注类别的招标信息进行结构化处理,输出筛选后的招标信息。本公开能够精准定位网页中的招标信息区域,以及实现跨网站及长期动态变化下的招标信息稳定识别。