AI资讯新闻榜单内容搜索-智能体

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 智能体
o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界

o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界

o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界

GUI 智能体正以前所未有的速度崛起,有望彻底改变人机交互的方式。然而,这一领域的进展正面临瓶颈:现有数据集大多聚焦于 10 步以内的短程交互,且仅验证最终结果,无法有效评估和训练智能体在真实世界中的长时程规划与执行能力。

来自主题: AI资讯
7679 点击    2025-08-13 16:17
新加坡的Agent黑马Agnes,双杀技能:Deep Design × Wide Research重新定义智能体?

新加坡的Agent黑马Agnes,双杀技能:Deep Design × Wide Research重新定义智能体?

新加坡的Agent黑马Agnes,双杀技能:Deep Design × Wide Research重新定义智能体?

之前在X上看到过一个新加坡版的DeepSeek,叫Agnes AI,主打一站式Agent空间。 但当时我自己搞产品焦头烂额的,随手点开看了看,就放下了。 后来在Product Hunt上又看到这款产品,以及各种海外平台时而刷到。

来自主题: AI资讯
8258 点击    2025-08-13 12:32
从物竞天择到智能进化,首篇自进化智能体综述的ASI之路

从物竞天择到智能进化,首篇自进化智能体综述的ASI之路

从物竞天择到智能进化,首篇自进化智能体综述的ASI之路

近年来,大语言模型(LLM)已展现出卓越的通用能力,但其核心仍是静态的。面对日新月异的任务、知识领域和交互环境,模型无法实时调整其内部参数,这一根本性瓶颈日益凸显。

来自主题: AI技术研报
7160 点击    2025-08-13 11:32
具身智能体主动迎战对抗攻击,清华团队提出主动防御框架

具身智能体主动迎战对抗攻击,清华团队提出主动防御框架

具身智能体主动迎战对抗攻击,清华团队提出主动防御框架

面对对抗攻击,具身智能体除了被动防范,也能主动出击! 在人类视觉系统启发下,清华朱军团队在TPMAI 2025中提出了强化学习驱动的主动防御框架REIN-EAD。

来自主题: AI技术研报
7670 点击    2025-08-13 11:21
AI应用如何落地政企?首先不要卷通用大模型

AI应用如何落地政企?首先不要卷通用大模型

AI应用如何落地政企?首先不要卷通用大模型

智能体元年,处处都是智能体。甚至刚落幕的ISC.AI 2025第十三届互联网安全大会,主题直接就是“ALL IN AGENT”。

来自主题: AI资讯
7678 点击    2025-08-13 11:05
MiniMax 悬赏 15 万美元,重金求「子」

MiniMax 悬赏 15 万美元,重金求「子」

MiniMax 悬赏 15 万美元,重金求「子」

MiniMax 现在正在主动加速「从功能到可流通生产力」的进程。他们正在举办一场总奖金高达 15 万美元的 AI Agent 全球挑战赛,核心理念是「让自己的 Idea + Agent 成为生产力,成为市场中的硬通货」。Remix 则是官方重点推荐的参赛入口之一。

来自主题: AI资讯
7959 点击    2025-08-13 10:34
「一只手有几根手指」,你的GPT-5答对了吗?

「一只手有几根手指」,你的GPT-5答对了吗?

「一只手有几根手指」,你的GPT-5答对了吗?

「一只手有几根手指?」 这个看似简单的问题,强如 GPT-5 却并不能总是答对。 今天,CMU 博士生、英伟达 GEAR(通用具身智能体研究)团队成员 Tairan He(何泰然)向 GPT-5 询问了这个问题,结果模型回答错了。

来自主题: AI技术研报
7753 点击    2025-08-12 12:08
ARPO:智能体强化策略优化,让Agent在关键时刻多探索一步

ARPO:智能体强化策略优化,让Agent在关键时刻多探索一步

ARPO:智能体强化策略优化,让Agent在关键时刻多探索一步

在可验证强化学习(RLVR)的推动下,大语言模型在单轮推理任务中已展现出不俗表现。然而在真实推理场景中,LLM 往往需要结合外部工具进行多轮交互,现有 RL 算法在平衡模型的长程推理与多轮工具交互能力方面仍存在不足。

来自主题: AI技术研报
6845 点击    2025-08-10 13:29
首篇WebAgents综述:大模型赋能AI Agent,实现下一代Web自动化

首篇WebAgents综述:大模型赋能AI Agent,实现下一代Web自动化

首篇WebAgents综述:大模型赋能AI Agent,实现下一代Web自动化

互联网技术的发展极大地便利了我们的生活,但许多网络任务重复繁琐,降低了效率。为了解决这一问题,研究人员正在开发基于大型基础模型(LFMs)的智能体——WebAgents,通过感知环境、规划推理和执行交互来完成用户指令,显著提升便利性。香港理工大学的研究人员从架构、训练和可信性等角度,总结了WebAgents的代表性方法,全面梳理了相关研究进展。

来自主题: AI技术研报
8059 点击    2025-08-09 11:24
实测首款Agent蜂群,人人都可以造自己的视频版manus了

实测首款Agent蜂群,人人都可以造自己的视频版manus了

实测首款Agent蜂群,人人都可以造自己的视频版manus了

上上周我们一起测试了六款视频Agent, Agent们手里有一堆音频、视频、剪辑、生图等工具,由他们决定调用顺序成片

来自主题: AI产品测评
8092 点击    2025-08-09 11:05