自Agent火了以后,有关"记忆"的框架如雨后春笋般涌现,但绝大多数仍是为"单兵作战"设计,难以适应需要复杂协作、信息交互量暴增10倍的多智能体系统(MAS),为此,我非常荣幸地为大家带来G-Memory论文团队(来自新加坡国立大学、同济大学等顶尖学府)的亲笔解读。他们工作的独到之处,在于跳出"存得更多,记得更多"的内卷,另辟蹊径地首创了一套真正的"记忆管理"体系:通过G-Memory三层图架构,将MAS的记忆从杂乱的数据仓库,升华为能自我提炼与进化的"集体大脑",从而一举解决MAS"高耗、健忘、难进化"的三大顽疾。下面,让我们深入了解他们是如何做到的。以下为作者投稿内容:
独木不成林,随着大型语言模型(LLM)驱动的智能体(Agent)遍地开花,我们很快发现,单打独斗的Agent能力终究有限。于是,借鉴人类团队协作的智慧,多智能体系统(MAS)应运而生,通过分工合作,展现出远超单个智能体的强大认知和执行能力。
然而,在满心欢喜地部署MAS解决复杂问题时,你是否也遇到了这些令人头疼的瓶颈:
别再让你的智能体团队"健忘"了!来自 新加坡国立大学、同济大学、UCLA、A*STAR、南洋理工大学 的研究团队重磅推出 G-Memory,一个专为多智能体系统设计的开创性分层记忆框架,让你的Agent团队不仅能干活,更能持续成长和进化!
论文标题: G-Memory: Tracing Hierarchical Memory for Multi-Agent Systems
论文链接: https://arxiv.org/abs/2506.07398 [1]
代码链接: https://github.com/bingreeky/GMemory [2]
问题的核心:为何MAS需要专属记忆?
在深入了解G-Memory之前,我们必须先直面一个根本问题:既然现在单智能体已经存在相当多的Memory架构设计,为什么不能简单地把单智能体的记忆方法嫁接到MAS上?
答案藏在下面这张图里。
添加图片注释,不超过 140 字(可选)
可以看到,MAS为了完成任务,其内部的多轮、多角色沟通会产生海量的交互文本。如果像单智能体那样,将所有历史记录不加区分地塞进记忆库,不仅成本高昂,更会让LLM在冗余信息中迷失方向,难以提取真正有价值的经验。
因此,一个理想的MAS记忆系统必须能够:
这正是G-Memory诞生的使命。
G-Memory: 独创三层图记忆架构
受组织记忆理论的启发,G-Memory创造性地设计了一个 三层图(Three-Tier Graph) 结构来管理MAS的集体记忆。这三层各司其职,又紧密相连,构成了智能体团队的"记忆宫殿"。可视化如图1所示。
第一层:交互图 (Interaction Graph) - "原始案卷"
第二层:查询图 (Query Graph) - "任务档案库"
第三层:洞见图 (Insight Graph) - "智慧结晶"
G-Memory工作流:双向检索与动态进化
G-Memory的工作流如图2所示。当一个新任务到来时,G-Memory的记忆检索并非盲目捞取,而是一个高效的 双向遍历(Bi-directional Traversal) 过程:
1.定位:首先在 查询图 中找到与新任务最相似的历史任务节点,操作如下所示:
2.向上追溯 (Upward Traversal):从这些历史任务节点出发,向上访问 洞见图,获取高屋建瓴的、普适性的"战略指导",操作如下所示:
3.向下挖掘 (Downward Traversal):同时,向下深入到对应的 交互图 中,利用LLM提取出最关键、最核心的"战术片段"(例如导致失败的关键一步或合作成功的核心对话),避免信息过载。操作如下所示:
当任务执行完毕,G-Memory会根据结果 动态更新 所有三层图,将新的交互、新的任务节点、以及可能产生的新"洞见"融入记忆体系,为每个智能体提供精简且高效的记忆支持:
如此循环往复,智能体团队的集体智慧便在一次次实战中不断积累和升华。
效果惊人:全面超越,成本可控
G-Memory是否只是听起来很美?实验数据给出了响亮的回答。在5个主流基准数据集、3种LLM和3个知名MAS框架上的大量实验证明,G-Memory是名副其实的"性能加速器"。5个数据集包括ALFWorld、SciWorld、PDDL、HotpotQA、FEVER等。单智能体Memory基线方法包括Voyager、MemoryBank、Generative Agents等,多智能体Memory基线方法包括来自MetaGPT、ChatDev、MacNet等系统的记忆模组。
性能提升显著:
从上表可以看出,无论是与无记忆、单智能体记忆还是其他简化的MAS记忆相比,G-Memory都带来了显著的性能提升。
成本效益极高:
上图展示了性能与Token消耗的权衡。G-Memory总能在相似甚至更低的成本下,达到远超其他方法的性能水平,真正做到了"好钢用在刀刃上"。
案例分析:G-Memory如何"运筹帷幄"
让我们通过一个生动的案例,看看G-Memory在实战中是如何发挥作用的。
场景:ALFWorld + AutoGen 框架
有了这些来自"集体记忆"的宝贵线索,智能体团队在执行新任务时,就能主动规避曾经犯过的错误,大大提高执行成功的概率。
总结与展望
G-Memory通过其创新的 三层图分层记忆架构,成功解决了当前多智能体系统普遍存在的"健忘"和"无法进化"的痛点。它作为一个即插即用的模块,能够无缝集成到主流MAS框架中,显著提升其在各类复杂任务上的性能,同时保持了极高的资源效率。
我们相信,G-Memory为构建能够持续学习、适应和演化的智能体团队铺平了道路。未来,我们期待看到G-Memory在更广泛的领域,如机器人长程规划、真实世界决策系统、协同AI助手等方面大放异彩,让多智能体系统真正拥有强大的"集体大脑"!
引用链接
[1]: https://arxiv.org/abs/2506.07398
[2]: https://github.com/bingreeky/GMemory
文章来自公众号“AI修猫Prompt”,作者“G-Memory研究团队”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0