AI资讯新闻榜单内容搜索-GUI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GUI
AI也能操作手机了!DroidRun 让 Agent 实现智能手机自动化操作!

AI也能操作手机了!DroidRun 让 Agent 实现智能手机自动化操作!

AI也能操作手机了!DroidRun 让 Agent 实现智能手机自动化操作!

继 BrowserUse 和 ComputerUse 席卷 AI 自动化领域后,手机操作类项目终于迎来重磅选手:DroidRun!开源 AI 手机操作神器,解锁 Android 自动化新时代!

来自主题: AI资讯
7086 点击    2025-04-16 09:31
移动GUI智能体迈向实用化!全新验证器架构V-Droid,刷新成功率纪录

移动GUI智能体迈向实用化!全新验证器架构V-Droid,刷新成功率纪录

移动GUI智能体迈向实用化!全新验证器架构V-Droid,刷新成功率纪录

移动GUI自动化智能体V-Droid采用「验证器驱动」架构,通过离散化动作空间并利用LLM评估候选动作,实现了高效决策。在AndroidWorld等多个基准测试中任务成功率分别达到59.5%、38.3%和49%,决策延迟仅0.7秒,接近实时响应。

来自主题: AI技术研报
5913 点击    2025-04-15 14:53
智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作

智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作

智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作

随着人工智能和大语言模型(LLMs)的不断突破,如何将其优势赋能于现实世界中可实际部署的高效工具,成为了业界关注的焦点。

来自主题: AI技术研报
2640 点击    2025-04-03 15:19
AI玩手机越玩越6!西湖大学发布新智能体:会自我进化的AppAgentX

AI玩手机越玩越6!西湖大学发布新智能体:会自我进化的AppAgentX

AI玩手机越玩越6!西湖大学发布新智能体:会自我进化的AppAgentX

人工智能正迎来前所未有的变革,其中,大语言模型(LLM)的崛起推动了智能系统从信息处理向自主交互迈进。

来自主题: AI技术研报
7053 点击    2025-03-09 13:39
微软GUI智能体OmniParser二代开源!推理延迟降低60%,大模型玩手机更溜了

微软GUI智能体OmniParser二代开源!推理延迟降低60%,大模型玩手机更溜了

微软GUI智能体OmniParser二代开源!推理延迟降低60%,大模型玩手机更溜了

OmniParser V2可将屏幕截图转换为结构化元素,帮助LLM理解和操作GUI;在检测小图标和推理速度上显著提升,延迟降低60%,与多种LLM结合后表现优异。

来自主题: AI技术研报
7949 点击    2025-03-07 16:14
无直接数据可用,AI怎么学会「干活」?微软团队揭秘AI从语言到行动的进化之路

无直接数据可用,AI怎么学会「干活」?微软团队揭秘AI从语言到行动的进化之路

无直接数据可用,AI怎么学会「干活」?微软团队揭秘AI从语言到行动的进化之路

该技术报告的主要作者 Lu Wang, Fangkai Yang, Chaoyun Zhang, Shilin He, Pu Zhao, Si Qin 等均来自 Data, Knowledge, and Intelligence (DKI) 团队,为微软 TaskWeaver, WizardLLM, Windows GUI Agent UFO 的核心开发者。

来自主题: AI技术研报
5737 点击    2025-01-21 22:16
引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述

引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述

引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述

图形用户界面(Graphical User Interface, GUI)作为数字时代最具代表性的创新之一,大幅简化了人机交互的复杂度。

来自主题: AI技术研报
7514 点击    2025-01-09 14:39
纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5

纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5

纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5

Aria-UI通过纯视觉理解,实现了GUI指令的精准定位,无需依赖后台数据,简化了部署流程;在AndroidWorld和OSWorld等权威基准测试中表现出色,分别获得第一名和第三名,展示了强大的跨平台自动化能力。

来自主题: AI技术研报
9107 点击    2025-01-09 10:54