OmniParser V2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
OmniParser V2
访问
424
1979

将任何LLM转变为计算机使用代理


OmniParser将UI截图从像素空间“标记化”为截图中的结构化元素,这些元素可由LLMs解释。这使得LLMs能够基于一组已解析的可交互元素进行检索,从而预测下一步操作。