哈喽,大家好,我是刘小排。
昨天和几位创业的朋友吃饭,席间讨论了一个问题:“在Claude Code中,最好的浏览器自动化方案是什么?”
在刚有MCP的时候,我写过一些浏览器自动化文章,那时,最好用的Playwright MCP和一些第三方的浏览器自动化工具,还不算稳定。
(参考:所有的RPA可以去死了!Claude Code可以只靠口喷完成一切!)
大半年过去了,现在最流行、稳定、专门针对Agent的浏览器自动化方案已经有了三个明显的头部:Agent Browser 、Devtools MCP 、Playwright MCP,开发者分别是Vercel、Google、微软。
像下图这样的简单任务,这3个都做得很好。

那到底选哪个呢?哪个最好呢?
如果你想知道一个最简单直接的答案:请你选择Devtools MCP,它在大部分场景下是最全能的。
如果你有耐心想了解更多,可以往下看,因为它们的特性各有不同,需要根据不同的场景来选择。
声明:表格是我和AI一起做的,所以用语可能稍微有点AI味儿,但我对内容质量和准确性负责。


一句话:轻量快速,省 token

一句话:专业、完整、稳定、慢

一句话:调试代码、性能分析、抓网络请求
为什么这么说?
这是因为Agent Browser太节省Token了,节省Token意味着速度快。
在我不写程序的时候,我也不一定使用Claude Code,而是使用Cowork、Craft Agents等图形化工具。
下面是我在Craft Agents里、使用Agent Browser来刷生财有术网站的过程。 这个过程,Agent Browser、Devtools MCP、Playwright MCP都能做到,但是Agent Browser明显最快、体验最佳。
刚开始,我们可以登录以后,保存Cookie,后面就不再需要登录了,甚至电脑上可以不出现浏览器界面。
用Agent Browser打开scys.com 让我登录,然后保存登录信息

登录成功,右上角是我的头像。注意,此时Agent Browser启动的浏览器,左上角有一个小的TEST标,如下图所示

我们让AI自动查看最近50条风向标
我已经登录好了,你找到“风向标”栏目,总结最近50个风向标,有什么亮点

整体总结

选择其中一条,详细查看。
我觉得你刚才说的 2 ,特别好,展开讲讲

期待你的反馈
文章来自于“刘小排r”,作者 “刘小排”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md