
AI Agent组团搞事:在你常刷的App里,舆论操纵、电商欺诈正悄然上演
AI Agent组团搞事:在你常刷的App里,舆论操纵、电商欺诈正悄然上演近日,上海交大和上海人工智能实验室的研究发现,AI 的风险正从个体失控转向群体性的恶意共谋(Collusion)——即多个智能体秘密协同以达成有害目标。Agent 不仅可以像人类团队一样协作,甚至在某些情况下,还会展现出比人类更高效、更隐蔽的「团伙作案」能力。
近日,上海交大和上海人工智能实验室的研究发现,AI 的风险正从个体失控转向群体性的恶意共谋(Collusion)——即多个智能体秘密协同以达成有害目标。Agent 不仅可以像人类团队一样协作,甚至在某些情况下,还会展现出比人类更高效、更隐蔽的「团伙作案」能力。
“Agent元年”进程过半,Agent虽已从处理简单任务转向复杂交付,却仍卡在“信息断层”的关键瓶颈—— 受限于训练数据截止日期,难以及时获取实时动态信息,企业级场景落地始终差临门一脚。
杜克大学与 Zoom 的研究者们推出了 LiveMCP-101,这是首个专门针对真实动态环境设计的 MCP-enabled Agent 评测基准。该基准包含 101 个精心设计的任务,涵盖旅行规划,体育娱乐,软件工程等多种不同场景,要求 Agent 在多步骤、多工具协同的场景下完成任务。
做销售的朋友大概都有过这样的经历:跟进客户时要在邮箱、微信、Excel 间反复切换,好不容易把信息汇总到 CRM 系统,却发现格式不对要重新调整。这种 "人围着系统转" 的困境,正在被一家叫 Attio 的初创公司改写。
刚刚,Anthropic发布了最新的浏览器agent——Claude for Chrome! 这款紧贴Chrome的agent可以作为浏览器的扩展程序直接使用: 它不仅能帮你设日历。
AI加速走向落地,企业「超级大脑」却在关键时刻断片?行业亟需一套能够持续进化、越用越聪明的系统框架,实现多智能体协同作战,通过自优化、自反馈瞬间激活知识库。清华系黑马已将其塞进AI原生引擎,率先在能源、军工等硬核场景中规模化落地,为产业智能升级提供了可靠路径。
人工智能的浪潮正将我们推向一个由 RAG 和 AI Agent 定义的新时代。然而,要让这些智能体真正「智能」,而非仅仅是信息的搬运工,就必须攻克一个横亘在所有顶尖团队面前的核心难题。这个难题,就是推理密集型信息检索(Reasoning-Intensive IR)。
尽管 LLM 的能力与日俱增,但其在复杂任务上的表现仍受限于静态的内部知识。为从根本上解决这一限制,突破 AI 能力界限,业界研究者们提出了 Agentic Deep Research 系统,在该系统中基于 LLM 的 Agent 通过自主推理、调用搜索引擎和迭代地整合信息来给出全面、有深度且正确性有保障的解决方案。
只用一周,一个相当于人类20年经验的“数字技术工人”——基于时序大模型和Agent的智能体,就能直接上岗。
一个月前在德国被50多家投资人拒绝的AI创业公司,搬到硅谷后却能在一周内完成470万美元的融资,而且投资人几乎全部说"yes"。这不是什么励志鸡汤故事,而是Leaping AI创始人Kevin Wu的真实经历。