你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench 你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench 关键词: AI新闻,AI记忆,ATM-Bench,模型训练 ATM-Bench 将「个人 AI 助手是否真的记得你」这件事,变成了一个研究的测试基准。结果并不乐观:专用记忆智能体系统普遍低于 20%,而 OpenClaw、Codex、Claude Code 等通用智能体普遍表现不佳,最高准确率不到 40%。 来自主题: AI技术研报 9716 点击 2026-04-20 14:36