网页信息的提取方法、装置及电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
网页信息的提取方法、装置及电子设备
申请号:CN202411740080
申请日期:2024-11-29
公开号:CN119669590A
公开日期:2025-03-21
类型:发明专利
摘要
本发明提供了一种网页信息的提取方法、装置及电子设备,涉及信息处理的技术领域,该方法包括:获取第一网页和第二网页分别对应的层次信息;基于层次信息分别提取第一网页和第二网页中包含的预设标签的属性值;比对第一网页和第二网页中的预设标签的属性值,得到第一网页和第二网页的差异信息。本发明提供的网页信息的提取方法、装置及电子设备,能够获取第一网页和第二网页分别对应的层次信息,基于层次信息分别提取第一网页和第二网页中包含的预设标签的属性值;比对预设标签的属性值,以得到第一网页和第二网页的差异信息,可避免针对每个网站去撰写解析规则,不仅减小运维人员的维护工作,降低了运维成本,也提升了数据获取和解析的效率。
技术关键词
标签 电子设备 节点 分类模型识别 可读存储介质 数据 处理器 信息处理 关系 存储器 计算机 模块 运维 日期