一种网页中人物识别的处理方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种网页中人物识别的处理方法、装置、设备及介质
申请号:CN202411111528
申请日期:2024-08-14
公开号:CN118626742B
公开日期:2024-12-20
类型:发明专利
摘要
本申请涉及电数字数据处理技术领域,特别是涉及一种网页中人物识别的处理方法、装置、设备及介质。该方法包括:获取目标网页文档对应的文档对象模型树;按照从根节点向下的顺序依次判断文档对象模型树中的节点是否满足第一预设条件,若不满足,则继续判断下一节点;否则,停止判断;如果存在满足第一预设条件的节点,则获取其对应的子树集合;如果集合满足第二预设条件,则判断集合中每一子树是否满足第三预设条件;如果集合中每一子树均满足第三预设条件,则判定集合中每一子树对应一个人物,并对集合中每一子树进行解析,获取集合中每一子树对应的人物的信息。本发明能够从网页的HTML文档中提取网页展示的人物的相关信息。
技术关键词
文档对象模型 节点 图片 命名实体识别模型 字符串匹配算法 电数字数据处理技术 身份 可读存储介质 处理器 头像 中子 识别模块 年龄 存储器 计算机 电子设备