摘要
本申请公开了一种基于深度学习的页面布局及元素分析方法,旨在解决机顶盒页面的复杂性使得现有的目标检测与字符识别方法通常无法满足对页面元素进行高效、准确分析的需求的问题。本申请基于第一深度学习模型对机顶盒页面图像进行目标检测,识别出页面中的图像元素区域,并生成对应的多个图像框,根据图像框的面积大小确定直播窗口区域和海报推荐位区域:其中面积最大的图像框为直播窗口区域,其余的图像框为海报推荐位区域;基于第二深度学习模型对机顶盒页面图像中的字符进行识别,生成多个文本框;通过判断文本框之间的重叠情况、距离关系以及文本框与图像框的重叠情况,对重叠或相邻的原始元素进行合并处理。