WebMarker

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
WebMarker
访问
284
9848

为视觉语言模型标记网页


WebMarker通过为网页上的元素添加带有标签的可视化标记。这可以用于Set-of-Mark提示,从而提升GPT-4o、Claude 3.5和Google Gemini 1.5等视觉语言模型的视觉定位能力。