AI资讯新闻榜单内容搜索-ATM-Bench

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ATM-Bench
你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench

你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench

你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench

ATM-Bench 将「个人 AI 助手是否真的记得你」这件事,变成了一个研究的测试基准。结果并不乐观:专用记忆智能体系统普遍低于 20%,而 OpenClaw、Codex、Claude Code 等通用智能体普遍表现不佳,最高准确率不到 40%。

来自主题: AI技术研报
9716 点击    2026-04-20 14:36