超火的AI自动化操控浏览器神器!一夜爆火,5天内新增3K Star!AI智能体趋势使然。

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
超火的AI自动化操控浏览器神器!一夜爆火,5天内新增3K Star!AI智能体趋势使然。
7173点击    2024-12-29 10:41

在科技飞速发展的今天,我们的工作、生活与 AI 的关系正变得越来越紧密。


无论是语音助手解放双手,还是AI搜索节省时间,这些技术的普及无不在证明:AI 的价值不再只是科研实验室中的概念,而是实实在在融入了我们的日常生活。


然而,当我发现 Browser Use 这个工具时,还是被它的“开挂”能力给惊艳到了。


超火的AI自动化操控浏览器神器!一夜爆火,5天内新增3K Star!AI智能体趋势使然。


它允许通过 AI 代理自动操作浏览器,无论是发邮件、订机票,还是网页内容提取、文件存储、数据库操作等都直接用。


项目简介


Browser Use 是一个能让 AI 智能体自动化操作浏览器的开源工具。


超火的AI自动化操控浏览器神器!一夜爆火,5天内新增3K Star!AI智能体趋势使然。


它通过简单的几行代码,就能让 AI 模型像真人一样与网页互动,完成各种复杂任务,比如自动投简历、查询航班信息,甚至筛选模型。


底层也借助了微软的自动化框架 playwright 进行功能延展。


它可以用于多种用途,包括视觉识别、多个代理的并行管理以及多个标签页的自动管理。


11月刚刚开源,最近一周突然爆火,5天内标星数直接从 3.3k 飙升到 7.3k。


超火的AI自动化操控浏览器神器!一夜爆火,5天内新增3K Star!AI智能体趋势使然。


主要功能


  • • 自动化操作浏览器:可以自动操作浏览器,与网页交互,比如点击、填写表单、下载文件等,就像真人一样流畅。
  • • 视觉识别与HTML提取:内置的视觉识别功能和 HTML 元素解析工具,能帮助 AI 识别网页中的动态内容并作出准确判断。
  • • 自动多标签管理:支持自动管理多个浏览器标签页,智能调度任务。还可以并行多个 AI 智能体,分别处理不同任务,提高效率。
  • • 支持主流 LLM 模型:兼容 GPT-4o、Claude 3.5 Sonnet 等主流大模型,充分发挥 AI 的理解与决策能力。
  • • 自定义操作:允许用户定义个性化的任务流程,让工具更加适配具体需求。


快速使用


安装 browser-use


pip install browser-use


将API密钥添加到你的.env文件中


OPENAI_API_KEY=
ANTHROPIC_API_KEY=


启动代理


from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio

async def main():
    agent = Agent(
        task="Find a one-way flight from Bali to Oman on 12 January 2025 on Google Flights. Return me the cheapest option.",
        llm=ChatOpenAI(model="gpt-4o"),
    )
    result = await agent.run()
    print(result)

asyncio.run(main())


最后自动开启浏览器进行操作。


比如,投简历这件事本身并不复杂,但在不同网站间反复切换、手动输入信息却非常耗时。


可以通过 Browser Use 设计一个简单的脚本,让它自动打开招聘网站、登录账户、上传简历、甚至自定义申请留言。整个过程只需要提前设置好脚本,之后就可以坐等结果。


超火的AI自动化操控浏览器神器!一夜爆火,5天内新增3K Star!AI智能体趋势使然。


官方示例


1、阅读简历,找到与机器学习相关的职位,将它们保存到文件中,然后在新标签页中开始投递。


超火的AI自动化操控浏览器神器!一夜爆火,5天内新增3K Star!AI智能体趋势使然。


2、从2024年12月25日至2025年2月2日期间,在某平台上查找从苏黎世到北京的航班。


超火的AI自动化操控浏览器神器!一夜爆火,5天内新增3K Star!AI智能体趋势使然。


3、查找拥有cc-by-sa-4.0许可的模型,并按在Hugging Face上获得的最多点赞进行排序,将前5个保存到文件。


超火的AI自动化操控浏览器神器!一夜爆火,5天内新增3K Star!AI智能体趋势使然。


写在最后


Browser Use 是一款功能强大且灵活的开源工具,可以将 AI 智能体与浏览器操作完美结合,实现自动化、高效的网页交互。


不论是日常办公、信息查询,还是数据采集,都能大大节省人力和时间成本。


GitHub 项目地址:https://github.com/browser-use/browser-use


文章来自于微信公众号“开源星探 ”,作者“痕小子”


超火的AI自动化操控浏览器神器!一夜爆火,5天内新增3K Star!AI智能体趋势使然。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

4
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/