一种招标信息筛选方法、系统、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种招标信息筛选方法、系统、设备及存储介质
申请号:CN202511292212
申请日期:2025-09-11
公开号:CN120783363B
公开日期:2025-12-05
类型:发明专利
摘要
本公开涉及招标信息筛选领域,公开了一种招标信息筛选方法、系统、设备及存储介质,所述方法包括通过爬虫程序获取目标网站的网页信息;基于预设的网页结构识别规则库,从所述目标网站的网页信息中自动识别网页中招标信息所在的结构化数据区域;从所述招标信息所在的结构化数据区域中提取招标信息;对提取的所述招标信息进行多维度去重处理,得到去重后招标信息;对所述去重后招标信息进行自动化分类处理,得到标注类别的招标信息;对所述标注类别的招标信息进行结构化处理,输出筛选后的招标信息。本公开能够精准定位网页中的招标信息区域,以及实现跨网站及长期动态变化下的招标信息稳定识别。
技术关键词
信息筛选方法 信息筛选系统 机器学习模型 识别规则库 SimHash算法 密度 关键词 网页结构 子模块 动态时间窗口 文本 爬虫程序 集群 生成算法 视觉 节点 时效性 定位网页 数据 信息熵