基于大模型的视觉语义融合的页面元素定位方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于大模型的视觉语义融合的页面元素定位方法
申请号:CN202510713864
申请日期:2025-05-30
公开号:CN120257213B
公开日期:2025-09-23
类型:发明专利
摘要
本发明提供一种基于大模型的视觉语义融合的页面元素定位方法,属于数据处理技术领域,具体包括:以不同的特征群组的特征与其它的页面元素的相似情况,确定特征群组中的可信特征群组,将页面元素在可信特征群组存在相似特征的其它的页面元素作为关联页面元素,以关联页面元素在可信特征群组中不同维度的特征与页面元素的相似情况,确定不同维度的特征在可信特征群组的置信度,确定不同的可信特征群组之间的关联页面元素的偏差情况,并结合不同维度的特征在所述可信特征群组的置信度,确定页面元素的定位处理方法,提升了定位处理的准确性。
技术关键词
页面元素定位方法 动态页面 识别偏差 置信度阈值 图像视觉特征 数据处理技术 语义特征 指令 基础