谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意
9371点击    2025-11-19 17:15

OpenAI定义的L3 AI,要被谷歌抢先一步了。


最新内测显示:Gemini可连续运行40分钟处理同一任务。


在这段时间里,Gemini能根据用户输入,自动生成100+条创意,并由一组Agent对这些创意进行打分,排名,产出结构化的评审报告。


如此一来,用户不必再面对AI的草稿式输出,只需像筛选成熟方案一样,从智能体打磨后的结果中直接挑选即可,大幅减少了与单个Agent来回磨合的时间。


换句话说,你只需负责决策拍板,探索和迭代的过程,全由Agent代劳。


谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意


据悉,这种“先由点子生成器想方案,再由评审团进行竞赛式打分”的多智能体系统,在面向用户的产品中还是首次亮相


果然,巴菲特的眼光绝对不会错——谷歌还是那个谷歌。


谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意


多智能体竞赛系统


如何让智能体不再只是“回答问题”,而是把大伙的输入“当个事办”?


谷歌的做法是把多智能体工作流长时思考对抗式生成三件事直接缝在一起。


本质上,这是在用“时间”换“质量”。


一句提示会在多智能体系统内部经历一个长达40多分钟的、完整的生成—竞争—筛选流程,而不是一次性吐出答案。


具体来看,Gemini for Enterprise的多智能体系统会首先接收主题与评估标准,大规模生成初始创意(100+)。


随后,多个Agent以竞赛方式对这些创意进行评分,排序。


由此,呈现给用户的不是一条回答,而是一套经过完整流程沉淀出来的结果:


约100个创意,按标准排序,并附带概述、细节、评论、完整评审记录,以及独立生成的“比赛表现报告”。


谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意


在当前预览版中,谷歌推出了两个基于此竞赛系统的应用场景:


  • 创意生成:用户提供主题后,系统启动多智能体竞赛流程,生成并排序与主题相关的创意。


  • 合作科研:用户指定研究主题并提供数据,由智能体通过相同机制生成和评估创意,更侧重科研类任务。


谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意


事实上,谷歌早在今年2月就发布过科研辅助类的Agent,但与这次内测的能力相比,功能规模和表现都不是一个量级。


谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意


一方面,单次推理的可持续时长直接被拉高到40分钟。


另一方面,系统在推理期间能够结合对抗式生成,产出结构化、有洞见的内容。


这不仅让Agent得以承担更复杂的任务,也提升了人机协作效率。


此外,为了方便系统确认需求和节省算力,系统在正式运转前会先给出一份“计划评估项目和创意维度”的概要,只有用户确认后才开始执行任务。


谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意


除了竞赛系统,谷歌还在测试一个新的“文档对话智能体”。


谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意


它拥有独立界面,允许用户上传最大30MB的PDF文件,并直接与文档内容进行对话。


系统会把最多30MB的PDF内容整合到模型上下文中,使用户能够从长文档中提取更高质量的结论与信息。


尽管这些功能目前都集成在Gemini 企业版并仍在开发中,但我们仍可以将谷歌的这次尝试视作其向L3级人工智能产品迈进的一次重要探索。


L3 AI,谷歌先行一步


去年,OpenAI提出了五级AI分类体系,用以追踪通用人工智能(AGI)的发展。


按这一体系,去年位于L1(会话型AI)向L2(推理型AI)发展的阶段。


而今年,随着Agent技术的快速发展,L3 级代理型AI开始走上舞台。


L3的核心在于“代理能力”,即AI可以在用户授权下自主执行任务,并在多天内持续运行、适应环境变化。


可以说,L3的关键在于长时间自主运行


这也是Gemini能够连续40分钟进行多智能体对抗式生成的意义所在:


通过长时运行、多Agent协作和企业级算力支撑,它将“在单一任务上持续工作数十分钟并迭代优化”的能力落地为可用产品,向L3的定义靠近了一步。


有网友甚至推测,照这个发展速度,明年可能就会出现能够连续工作3小时的Agent。


谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意


而另一位网友则回应到:Anthropic给的时间线是2026年连续工作8小时。


到时,人类所做的将仅是设计好问题和评估标准,其余任务都可以交给Agent 自主完成。


谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意


而随着合作科研的进一步开发,Gemini没准也能够一够L4(创新者)的门槛。


谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意


让我们拭目以待。


参考链接:

[1]https://www.testingcatalog.com/google-to-enable-research-automation-on-gemini-enterprise/

[2]https://x.com/testingcatalog/status/1990177061852328329


文章来自于“量子位”,作者 “henry”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md