Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!
8272点击    2026-04-17 09:14

Gemini 终于推出桌面客户端了!除了能做网页端的一切,它的杀手锏是能捕捉屏幕上所有窗口,突破浏览器限制,把一切都装进模型上下文,帮你解读一切。


这两年只要聊桌面 AI 助手,大家脑子里先跳出来的,基本都是 ChatGPT 和 Claude。


前者早早把客户端铺进 Mac,后者也早就把桌面入口做出来了。


结果谷歌这边,Gemini 一直挂在网页里,多少有点拧巴。


模型声量很大,桌面存在感却一直差口气。


现在,这个坑终于补上了。


谷歌正式推出 Gemini 的 macOS 原生客户端,支持全局快捷键拉起,也能直接共享当前窗口。


Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!

https://gemini.google/mac/


这件事其实分量很重。


因为网页端再强,终究还是网页端。


你得先开浏览器,找到那个标签页,切进去,问完,再切出来。


整个过程是破碎的,像是临时找人帮个忙。


客户端不一样,它会一直贴在桌面边上,像一个随时能被叫出来的桌宠。


只要这个入口真的常驻,Gemini 后面才有机会突破浏览器的壳,去碰文档,碰表格,碰代码窗口,碰你当下正在处理的那堆东西。


很多朋友可能会觉得,不就是多了个 App 吗,有这么夸张吗。


还真有。


因为今天大家争的早就不是谁会聊天,谁会写个邮件,谁能做总结。


大家争的是谁能离工作流更近,谁能更像一个一直在屏幕边上待命的助手。


Gemini 现在终于也坐到这张桌子上了。


官方到底发了啥,亮点在哪


先看官方公告。


第一,Gemini Mac 版是原生客户端,不是网页壳套个桌面图标糊弄一下。


谷歌官方说,这是原生 macOS 体验。


Gemini 产品负责人 Josh Woodward 也在 X 上透露:一个小团队,不到 100 天,做了 100 多个功能,还是 100% 原生 Swift。


Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!

https://x.com/joshwoodward/status/2044452201947627709


这个表态挺有意思,潜台词很明显,谷歌知道大家对桌面端这件事已经催很久了,所以这次要先把使用体验等基本盘给稳住。


第二,Gemini 终于能从任何界面被叫出来了。


Option + Space,直接拉起迷你聊天窗口。


Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!


Option + Shift + Space,进入完整聊天界面。


Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!


Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!


浅色主题挺漂亮的,深色主题也相比网页端更惊艳了,背景从灰色变成纯黑色。


Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!

客户端


Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!

网页端


这个设计有点像把 Gemini 塞进了苹果搜索 Spotlight 那个位置。


你在写方案也好,看财报也好,做表格也好,脑子里突然卡一下,想问个日期、公式、思路、翻译、灵感,手不用离开当前工作区太远,Gemini 就弹出来了。


这种低摩擦感,往往比模型参数更能决定一个产品会不会被高频使用。


第三,也是这次最关键的一点,Gemini 可以直接看你正在看的东西了。


官方给了窗口共享功能。


Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!


需要先授予客户端所需的两个权限。


Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!


你可以把某个窗口分享给 Gemini,它就能基于眼前这块内容给反馈。


Gemini桌面客户端终于上线:直接读取屏幕上下文,帮你解读一切!


文章来自于"新智元",作者 "艾伦"。

关键词: AI新闻 , 谷歌AI , Gemini Mac , Gemini
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费