基于大模型的视觉语义融合的页面元素定位方法

申请号：CN202510713864

申请日期：2025-05-30

公开号：CN120257213B

公开日期：2025-09-23

类型：发明专利

摘要

本发明提供一种基于大模型的视觉语义融合的页面元素定位方法，属于数据处理技术领域，具体包括：以不同的特征群组的特征与其它的页面元素的相似情况，确定特征群组中的可信特征群组，将页面元素在可信特征群组存在相似特征的其它的页面元素作为关联页面元素，以关联页面元素在可信特征群组中不同维度的特征与页面元素的相似情况，确定不同维度的特征在可信特征群组的置信度，确定不同的可信特征群组之间的关联页面元素的偏差情况，并结合不同维度的特征在所述可信特征群组的置信度，确定页面元素的定位处理方法，提升了定位处理的准确性。

技术关键词

页面元素定位方法动态页面识别偏差置信度阈值图像视觉特征数据处理技术语义特征指令基础