对话「光年之外」团队:关于 Tabbit 浏览器的一些产品思考

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
对话「光年之外」团队:关于 Tabbit 浏览器的一些产品思考
8586点击    2026-03-04 10:35

今天 Tabbit 发布了,这是他们的产品演示视频:


对话「光年之外」团队:关于 Tabbit 浏览器的一些产品思考


Tabbit 背后的团队,是美团的光年之外

对,就是那个最早由王慧文老师创办,后来并入美团的那个光年之外


大概一个月前,我和 Tabbit 的产品团队开了一场线上的交流会。那时候产品还在内测阶段,我跟他们的产品负责人也是老相识,就约了个时间,随便聊了聊这个还在雏形中的工具


对话「光年之外」团队:关于 Tabbit 浏览器的一些产品思考


这篇内容【并非评测】,只想把当时那场对话里,关于「浏览器该往何处去」的几点思考记录下来


本文观点,【来自光年之外团队】,我作为整理和记录者,或许能给同样关注 AI 应用的朋友一些参考


App 是孤岛,浏览器是大陆


当时我们聊到的第一个话题,是关于平台


我们现在的数字生活被割裂成了两半。一半在手机上,一半在电脑上


在移动端,App 之间的数据壁垒很高。微信的数据很难流转到飞书,飞书的数据也很难直接同步到钉钉。每个 App 都是一座孤岛,它们守着自己的护城河,严防死守。在这样的环境里,AI 想要跨应用获取上下文,技术上很难,商业壁垒更高。手机上的 AI 助理,往往只能在系统层面上做一些浅层的调度,或者在某个 App 内部打转。


但在 PC 端,情况完全不同:浏览器承载了绝大多数的工作场景


仔细回想一下工作流。你的 OA 系统、协作文档、查阅的资料、购买的数据库、邮件、日历,几乎都在浏览器的一个个标签页里


在这个环境里,数据是流动的,DOM 结构是公开的


有一个非常有意思的比喻:


Cursor 是程序员的 IDE(集成开发环境),那么浏览器应该是所有白领和知识工作者的 IDE


程序员写代码,需要一个环境来管理代码库、运行调试、查看文档。白领处理信息,同样需要一个环境来管理信息源、处理数据、输出文档


基于这个逻辑,他们选择基于 Chromium 重做了一个浏览器。只有掌握了底座,才能完整、低摩擦地处理用户上下文


如果是插件,它只能依附于页面,权限受限,交互受限。而作为一个浏览器,AI 拥有了「上帝视角」。它可以读取你当前页面的 DOM 结构,可以理解你正在处理的文档,甚至可以帮你操作网页上的按钮


通过这种底座式的能力,让 AI 变成了一个操作系统的延伸,进入了工作环境


自然语言编译脚本


我是一个重度的信息收集者,经常需要从网页上抓取视频素材,或者把一些技术文档的网页内容转成 Markdown 格式,丢给 Claude 去做二次处理


对此,我的解决方案非常繁琐。我付费订阅了一些第三方的下载工具,或者在浏览器里装了一堆插件


有时候插件失效了,我就得自己打开 F12 开发者工具,去 Network 标签页里扒 m3u8 地址,或者去 Elements 里复制 HTML 代码


这是一个典型的「懂技术的人觉得烦,不懂技术的人觉得难」的场景


Tabbit 的朋友,当时给我演示了一个 Demo他在侧边栏输入了一句大白话:“帮我通过读取 HTML 代码,下载这个页面里的视频。”


接下来的过程非常快。AI 分析了当前页面的 DOM 结构,识别出了视频播放器的容器,找到资源的请求地址,然后在后台生成了一段 JavaScript 脚本


几秒钟后,脚本自动运行,视频就开始下载了这个功能的本质,是工具定义权的下放


在过去,如果我们想对网页进行某种批量操作或修改,我们需要等待开发者开发插件,或者自己去学习写 UserScript(油猴脚本)。这道门槛把绝大多数人挡在了门外


现在,自然语言完成了这个编译过程。AI 充当了那个“翻译官”,把你的意图翻译成了浏览器听得懂的代码


你可以让它屏蔽所有带广告标签的 Div,也可以让它把当前页面的表格数据清洗后导出为 Excel,甚至可以让它帮你把网页变成深色模式


在演示中,他们还展示了如何用脚本去自动化填写一些重复性的表单。对于很多需要处理大量枯燥流程的运营人员来说,这种能力把浏览器从一个只读的信息获取工具,变成了一个可编程的操作环境


网页成为了一个可以被捏合、被重塑的泥板


后台并行的 Agent


这个浏览器也是支持 Agent 功能的,和其他 Agent 产品一样,其任务运行在一个独立的标签组里


比如,你让它去“调研市面上所有的 AI 手机竞品,并汇总参数”。它会自己在一个独立的后台环境里打开 Google,搜索相关信息,打开一个个网页,读取内容,进行汇总


在这个过程中,用户可以在主窗口继续自己的工作,写文档、回邮件,互不干扰。等它跑完了,会给你一个通知,并交付结果


这种设计逻辑把 Agent 看作一个不打扰人的后台进程,当你需要 AI 帮你干活时,你不需要停下手头的工作去等它


这也回归了计算机多任务处理的用处:把耗时的、重复的任务挂起,把宝贵的注意力和屏幕空间留给需要人类判断的高价值工作


关于细节


那次会议,我也注意到了他们对细节的关注


比如前段时间,Mac 的设计语言,变成了「毛玻璃」,为了让 Windows 侧的视觉效果保持统一,他们也在 Windows 上实现了毛玻璃特效


再比如,对垂直标签页交互的优化


我是习惯于动不动就打开几十个标签页,对我来说横向标签栏简直是噩梦。标签页挤在一起,连图标都看不清,更别说标题了。垂直标签页解决了 Tab 爆炸的问题,让侧边栏可以收起,屏幕利用率得到提升,信息的层级也更清晰


光年之外这个团队,接受了“浏览器是我们主要工作场所”这个事实,并试图在这个基础上,用 AI 把这个场所装修得更顺手一些


以上就是那次对话的主要内容。当然,以上这些东西,便是作为记录


对话「光年之外」团队:关于 Tabbit 浏览器的一些产品思考

https://www.tabbit-ai.com/


文章来自于“赛博禅心”,作者 “金色传说大聪明”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md