登录成功后会自动刷新界面
为视觉语言模型标记网页
WebMarker通过为网页上的元素添加带有标签的可视化标记。这可以用于Set-of-Mark提示,从而提升GPT-4o、Claude 3.5和Google Gemini 1.5等视觉语言模型的视觉定位能力。