一种基于深度学习的页面布局及元素分析方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于深度学习的页面布局及元素分析方法
申请号:CN202511006492
申请日期:2025-07-21
公开号:CN120913191A
公开日期:2025-11-07
类型:发明专利
摘要
本申请公开了一种基于深度学习的页面布局及元素分析方法,旨在解决机顶盒页面的复杂性使得现有的目标检测与字符识别方法通常无法满足对页面元素进行高效、准确分析的需求的问题。本申请基于第一深度学习模型对机顶盒页面图像进行目标检测,识别出页面中的图像元素区域,并生成对应的多个图像框,根据图像框的面积大小确定直播窗口区域和海报推荐位区域:其中面积最大的图像框为直播窗口区域,其余的图像框为海报推荐位区域;基于第二深度学习模型对机顶盒页面图像中的字符进行识别,生成多个文本框;通过判断文本框之间的重叠情况、距离关系以及文本框与图像框的重叠情况,对重叠或相邻的原始元素进行合并处理。
技术关键词
元素分析方法 机顶盒页面 深度学习模型 图像 DBSCAN算法 布局 海报 文本 标注工具 邻域 数据 字符识别方法 训练集 初始聚类中心 核心