亚马逊Agent克服遗忘的“秘诀”，被中国团队掌握，让大模型遗忘率趋近于0

8389点击 2025-12-08 09:49

国内记忆框架首开源，企业实战已上线运行。

AI很聪明，但记性很差。

你大概也遇到过这样的场景：第一轮对话里告诉智能客服“我对海鲜过敏”，聊到第十轮，它却依然热情推荐海鲜自助。

在企业服务里，用户换一个渠道、换一个Agent，之前提供的信息就像从没出现过一样，用户体验被“AI的健忘症”一再打断。

对于正在大规模“上云”和“上AI”的企业来说，这是每天都会撞上的真实业务问题：

如果不能让AI持续记住用户、记住业务现场，再强的大模型也很难扛起真实的服务指标。

这种痛点在全球云厂商的实践中已经被验证。亚马逊云科技在今年的Agentic AI基础设施实践经验系列中专门拿出一篇，讨论大模型在“记忆”上的先天缺陷，并提出要在Agent体系里单独建设记忆模块，区分短期记忆和长期记忆，将“记忆”从附属能力升级为Agentic AI基础设施的一部分。

亚马逊Agent克服遗忘的“秘诀”，被中国团队掌握，让大模型遗忘率趋近于0

▲亚马逊AWS官方博客

在海外巨头已经将“记忆系统”提升到基础设施层的同时，

红熊AI便是其中之一。公司成立于2024年，围绕多模态大模型与记忆科学开展研发，并将这些能力用于为企业提供智能客服、营销自动化与AI智能体服务。

12月1日，红熊AI正式发布记忆科学开源产品“记忆熊”（Memory Bear）。

这套系统已接入红熊AI自研的Agent互动服务平台，并在原有客服、营销、教育等多个业务场景中完成了落地。平台数据显示，单日最大AI接待量约35万次，AI自助解决率达98.4%，人工替代率达到70%。在接入记忆熊后，多轮对话的token消耗下降97%，大模型知识遗忘率被压至0.1%以下。与此同时，红熊AI的业绩也从最初预期的3000万元，上调至1.9亿元。

目前，红熊AI已将记忆熊的核心框架开源，并上线官网MemoryBear.AI，希望把“记忆”做成一项可以被开发者与企业直接调用的基础能力。

亚马逊Agent克服遗忘的“秘诀”，被中国团队掌握，让大模型遗忘率趋近于0

▲“记忆熊”官网MemoryBear.AI

01. AI的“记忆缺失”

难以支撑企业智能服务

在红熊AI接入的多个客服与营销项目中，其团队很快发现一个共性：不补上“记忆”这一块，再强的大模型也难以在B端场景中稳定扛住业务指标。

红熊AI发现，最先暴露出来的是单模型层面的知识遗忘。大模型依赖有限的上下文窗口来“记住”当前对话，早期信息会在长对话中被不断挤出，静态知识库也无法吸收用户在对话中补充的个性化信息。

此外，注意力机制天然存在“近因效应”，越靠后的信息越容易被模型抓住，越往前的细节越容易被忽略，这就造成了典型的“答完就忘”。同一个用户重复强调过几次的偏好和限制条件，只要跨过一定轮次，很容易在后续回答中消失。

亚马逊云科技在今年的Agent记忆实践文章里也做了类似总结：LLM本质是无状态的，每次调用都是一次新的推理，长上下文不仅不能彻底解决记忆问题，反而会带来性能下降和Token成本攀升，这一点和红熊在项目中的经验总结是高度一致。

其次是多Agent之间的记忆断层，咨询、售后、推荐等Agent都会各自维护独立记忆，切换时状态将无法完整继承，容易引发决策冲突。

第三类问题来自语义层面的歧义与行业术语。企业服务里的表达往往是口语化、多语言混用且高度依赖上下文的，具体指向什么，必须结合历史对话才能解释清楚。如果模型只能在当前轮次里做模式匹配，很容易给出模棱两可甚至错误的回复。

正是在这种背景下，红熊AI意识到，“记忆”需要被单独抽象为一套可设计、可治理的系统能力。

与AWS在Agent框架中加入专门记忆模块的思路类似，红熊团队选择从“重构记忆系统”入手，把“记性好不好”这件事交给一块独立的基础设施来负责。在模型之外再造一套独立、可控、可审计的记忆系统，这也是记忆熊的起点。

02. 从记忆到认知

记忆熊如何把“类人记忆”做成底层能力

记忆熊没有从堆叠更多参数入手，而是先把“人怎么记东西”这件事拆开：先搞清楚人类记忆的分类，再去给AI搭一套对应的记忆架构。

从记忆科学出发，记忆熊把人类感知记忆、工作记忆、显性记忆、隐性记忆、情绪记忆逐一映射到AI的多模态输入缓存、短期任务内存、结构化知识库、行为习惯模块和情感加权记忆等组件。

亚马逊Agent克服遗忘的“秘诀”，被中国团队掌握，让大模型遗忘率趋近于0

▲人类记忆与记忆熊的记忆映射

简单来说，看到什么、当下在处理什么、长期知道些什么、习惯怎么做决策、以及对不同事件“在意程度”有多高，都会在系统里有各自的位置和处理方式。

在此基础上，记忆熊把“人是如何记东西”的认知科学抽象成一整套可工程化的记忆架构：从多模态采集出发，到结构化图谱，再到分级审核与在线应用。

亚马逊Agent克服遗忘的“秘诀”，被中国团队掌握，让大模型遗忘率趋近于0

▲Memory Bear. AI记忆熊在线应用

03. 从客服到教育

记忆让AI大幅度提高在业务中的价值

从红熊AI披露的项目数据看，它已经实打实顶住了企业每天几十万次交互的业务现场。

其Agent互动服务平台在激烈竞争压力下，保持了较高的稳定性和服务质量：单日最大AI接待量达到35万次，AI自助解决率达98.4%，人工替代率达70%，复杂问题自动路由率达91.7%，模型幻觉率低于0.2%，业务回答准确率稳定在99%左右。

亚马逊Agent克服遗忘的“秘诀”，被中国团队掌握，让大模型遗忘率趋近于0

▲红熊AI Agent互动服务平台实践效果

这些核心指标也反映出“记忆”在提升服务连续性与一致性方面已发挥出一定的作用。

在技术评估上，记忆熊同样展现出明显优势。根据LOCOMO数据集测试结果，记忆熊在单跳、多跳、开放域以及时序类任务中的F1、BLEU与Judge分数均优于Mem0、Zep、LangMem等主流记忆方案，整体性能处于领先。

在具体行业场景中，红熊AI的能力也通过多个典型应用得到验证。从智能客服、营销自动化到教育辅导、企业内部知识管理等场景中，记忆熊通过跨会话、跨角色、跨渠道的统一记忆体系，让Agent始终保持连贯理解与稳定决策。

在生态层面，记忆熊已将核心框架开源至Github，并上线官网MemoryBear.AI，希望与开发者共同完善记忆科学技术体系。

随着Agent化应用越来越多、企业对“可控记忆”和“组织记忆中枢”的需求增强，像记忆熊这样的记忆平台有机会成为AI基础设施的一环。

04. 结语：记忆，能让AI变得更“有用”

红熊AI在记忆科学上的进展，把长期被忽视的“记忆”能力打造为可直接依赖的基础设施：一端承接多模态大模型和Agent的推理与生成能力，一端对接企业真实的业务流程与长期信息，使模型不再在每次交互中从零开始。

对行业而言，补上“记忆”这一块，大模型的表现将不再单一受限于上下文长度，而是由一套可持续积累、可持续调用的结构化记忆体系来支撑，使其在复杂的任务中保持更稳定的有效性。

随着多模态大模型、Agent框架与记忆科学不断融合，“记忆”这条技术主线会向更高层次的能力延展，让AI从短暂回应的工具，逐步演化为能理解、能延续，也能长时间工作的系统。

AI从“能回答”迈向“长期记忆、持续反馈”的那一步，很可能就建立在这块看不见却持续发挥作用的记忆基座之上。

文章来自于“智东西”，作者 “江宇”。

关键词: AI新闻 , 记忆熊 , Memory Bear , 红熊AI

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT