
阿里发布信息检索Agent,可自主上网查资料,GAIA基准超越GPT-4o | 模型&数据开源
阿里发布信息检索Agent,可自主上网查资料,GAIA基准超越GPT-4o | 模型&数据开源Agent能“看懂网页”,像人类一样上网?阿里发布WebDancer,就像它的名字一样,为“网络舞台”而生。
Agent能“看懂网页”,像人类一样上网?阿里发布WebDancer,就像它的名字一样,为“网络舞台”而生。
LLM 智能体(LLM Agent)正从 “纸上谈兵” 的文本生成器,进化为能自主决策、执行复杂任务的 “行动派”。它们可以使用工具、实时与环境互动,向着通用人工智能(AGI)大步迈进。然而,这份 “自主权” 也带来了新的问题:智能体在自主交互中,是否安全?
每年六月,千万家庭都在焦虑一件关乎个人命运的大事——高考填志愿。
开源且免费!谷歌对编程Agent出手了。
当下的AI Agent领域,正上演着一幕“奇特”的景象,一方面,是关于Agent能力极限的狂热探讨;但另一方面,是当这些光鲜的Agent从实验室走向真实生产环境时的普遍“失速”与“沉寂”。
生物医学研究是我们进行人类健康研究、疾病治疗、药物研发以及促进临床护理进步的基石。
大模型公司之外的玩家,怎么参与AGI?这家公司来打样了!一枚磁吸超薄「随身大脑」,录音转写翻译思考样样精通。别不信,这简直是我们见过的Agent最有用的玩法,无数海外用户已经夸爆了。
刚刚谷歌推出了 Gemini CLI,一个开源的 AI Agent,把 Gemini 的能力直接带到你的终端里。可以把它看作是谷歌版的 Claude Code。最香的是,这玩意儿开源、免费用,背后是带百万上下文的最强 Gemini 模型。
留给 Cursor 一枝独秀的时间不多了, 上周被 Anthropic 推出的 Claude Code 背刺,悄悄取消了500次的Agent对话限制, 这周又匹配上了新的对手, 出道两年半,带着插件时期积累下来的编程痛点,Comate AI IDE 来了!
大模型驱动的 AI 智能体(Agent)架构最近讨论的很激烈,其中一个关键争议点在于: 多智能体到底该不该建?