AI资讯新闻榜单内容搜索-工具

Agent-World：扩展真实世界环境，让智能体与环境协同进化！

随着MCP、Agent Skills与各类Harness的快速发展，大模型能轻松调用成百上千种外部工具，但在多工具，具备复杂状态、长程交互的任务上仍有明显短板。尽管一系列环境扩展方法尝试复刻真实世界的交互环境（如订票系统，外卖平台），但仍受限于环境扩展的规模与真实性。

来自主题: AI技术研报

6804 点击 2026-05-06 09:06

Claude被曝按关键字付费，现在官方愿意退款或者补偿，你准备好了？

不是 Anthropic 主动通知，不是账单透明到让用户自己看出来，是一个 Reddit 帖子，一个 YouTube 视频，一堆截图，在社区里流传开了，才终于有官方工作人员在 X 的评论区回复，说这是第三方恶意工具引入的 BUG，已经退款并做了补偿。

来自主题: AI资讯

8230 点击 2026-05-04 19:54

ACL 2026｜世界模型能让智能体「预知未来」？这篇新范式研究给了一个反直觉的答案

来自伊利诺伊大学香槟分校、清华大学、约翰霍普金斯大学以及哥伦比亚大学的研究人员在反复试验后，却得出来一个与我们的直觉有点相反的结论：大多数当下智能体并不能稳定、有效地把世界模型当作前瞻工具。

来自主题: AI技术研报

7400 点击 2026-05-04 10:16

千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型，我找到了跟Agent们的绝配

上周太集中发的后果就是光在用GPT -5.5了，小米的Mimo-V2.5-Pro，DeepSeek V4 Pro还没有放在Agent的场景上测。所以我跟钱包一拍即合，复制了4个一模一样的Hermes Agent，记忆一样，skill一样，系统设置一样，能调用的工具也一样。

来自主题: AI产品测评

11458 点击 2026-05-03 08:49

永别了，终端！OpenAI疯狂升级Codex，接管Mac人类全程0操作围观

OpenAI刚刚投下了一枚重磅炸弹：原本作为程序员「副驾驶」的Codex迎来史诗级更新，正式从代码工具进化为通用个人助理，奥特曼亲自下场带货。开发者实测后惊呼：Codex接管整台Mac，人类全程0操作围观，太炸裂了！

来自主题: AI资讯

9670 点击 2026-05-01 13:38

AI原生团队协作场景，CodeBanana来给大家打样了。

最近朋友推荐了 CodeBanana，说它跟之前用过的那些 AI 写代码的工具的体验感完全不同。我最近挑了几个真实工作场景跑了一遍，读项目、拆需求、写需求、生成测试用例、定时任务等等都和日常工作很贴近的任务进行了尝试。今天挑五个我自己觉得最值得讲的，跟你聊聊我的体验。

来自主题: AI资讯

8741 点击 2026-04-30 16:22

从龙虾热到 QoderWake，阿里给 AI 发了一张工牌

4 月 30 日，阿里发布全新 Agent 产品 QoderWake，定位是“生产可用、安全可控、自进化的数字员工”。它不是再做一个“更聪明的 AI 助手”，而是试图回答一个更难的问题：Agent 如何从工具变成岗位。

来自主题: AI资讯

10889 点击 2026-04-30 13:54

AI的下一步，是从工具变成同事 | 对话Helio王文锋

Helio.im创始人王文锋在即刻上发了一个内测帖，介绍了Sheet 0团队的新产品Helio，计划进行一场小范围的内部测试。结果第二天醒来，官网申请列表因访问量过大自动扩容了4次。整个周末，团队都被潮水般涌来的消息和几百条用户建议淹没了……

来自主题: AI资讯

9213 点击 2026-04-30 12:13

2026，Agent死于上下文失焦（附7大Claude Code 记忆遗忘与管理工具）

搭了个agent，结果该被记住的历史交互经验一点没记住，不该被记住的工具调用结果、过程输出被一股脑塞进上下文，导致输出质量下滑，类似的上下文失焦问题，这是多少人做agent时候的噩梦？

来自主题: AI技术研报

8681 点击 2026-04-30 08:35

OpenAI工程师把话挑明了：一个人盯3到5个Coding Agent，基本就到顶了！反手开源 Symphony ——一套「少盯人、多验收」的新系统

OpenAI工程师公开发帖承认：哪怕用的是Codex，一个人能有效监督的coding agent也就3到5个，再多生产率直接往下掉。更劲爆的是，OpenAI没有选择"让人盯更多屏幕"，而是直接开源了Symphony——一套把人类从"实时盯盘"解放成"异步验收"的全新工作流系统。近40万人围观，近3000人收藏。

来自主题: AI资讯

9561 点击 2026-04-29 22:11