2023年至今,检索增强生成(RAG)经历了从备受瞩目到逐渐融入智能体生态的转变。尽管有人宣称“RAG已死”,但其在企业级应用中的重要性依然无可替代。RAG正从独立框架演变为智能体生态的关键子模块,2025年将在多模态、代理融合、行业定制化等领域迎来新的突破。本文结合这几年的技术进展和未来趋势,深度探讨RAG在2025年的五大重点发展方向,欢迎关注阿东玩AI。
本文目录:
过去几年,RAG在技术创新和应用落地方面取得了显著进展,但也暴露了其局限性。以下是主要成就与挑战的总结:
过去几年的进展和挑战,结合RAG向智能体生态演化的趋势,以下是2025年RAG的五大重点发展方向,包含技术细节、应用场景和实践建议。
趋势背景:RAG正从独立框架转变为Agent系统的核心子模块,参与记忆管理、任务规划和多Agent协作。2025年,Agentic RAG将成为复杂场景(如医疗诊断、法律咨询)的标配。
技术细节:
以下举个例子,比如我前几天提到的项目:GraphRAG+DeepResearch架构。
应用场景:
挑战与解决方案:
实践建议:
趋势背景:多模态大模型(如ColQwen、LLaVA)的快速发展推动了多模态RAG的普及。2025年,多模态RAG将支持文本、图像、视频的统一检索,覆盖电商、医疗、教育等领域。
在介绍多模态之前先介绍一下,目前成熟的多模态RAG方案: 欢迎关注阿东玩AI 阿东玩AI 阿东玩AI
多模态RAG(MRAG)是RAG技术的延伸,旨在处理文本、图像、视频等多模态数据。其核心挑战包括:
(https://arxiv.org/pdf/2504.08748)
MRAG发展分为三个阶段:
MRAG系统包含以下核心组件:
https://arxiv.org/pdf/2503.18016
核心看两张图:
一个是五个不同的用于视频检索和理解流程的RAG模型一集对应的方案。
三种不同的多模态RAG(检索增强生成)流程,包括 :
(a) 将所有模态统一到单一的综合模态中;
(b) 将所有模态嵌入到一个共享的向量空间中;
(c) 为每种模态分别维护独立的数据库。
https://arxiv.org/pdf/2502.08826
流程从查询预处理开始,用户查询被优化后与多模态数据库一同编码到共享嵌入空间中。
检索策略,如模态中心检索、相似性搜索和重排序,增强文档选择,而融合机制通过分数融合或基于注意力的方法对齐并整合来自多种模态的数据。
增强技术,如带反馈机制的迭代检索,进一步优化了为多模态大模型(LLM)检索到的文档。
生成阶段融链式推理(Chain-of-Thought reasoning)和来源归因,以获得更好的输出结果。损失函数结合了对齐损失和生成损失,以优化检索和生成组件。
此外,应用噪声管理技术,以提高训练的稳定性和鲁棒性。
https://arxiv.org/pdf/2303.10868
应用场景:
挑战与解决方案:
实践建议:
趋势背景:GraphRAG通过知识图谱提升结构化召回能力,但创新空间收窄。2025年,GraphRAG将聚焦动态更新、因果推理和多模态节点优化,增强实时性和可解释性。
这里放一个经典的lightRAG的系统结构图:
后续会分享完整的GraphRAG综述及项目推荐。技术细节:
应用场景:
挑战与解决方案:
实践建议:
趋势背景:中小企业对RAG的需求聚焦低成本、易部署。2025年,轻量化RAG将成为中小企业的首选,边缘设备和低代码平台将广泛应用。
这里放一个港大开源MiniRAG突破大模型限制,轻量高效还免费:
技术细节:
应用场景:
挑战与解决方案:
实践建议:
趋势背景:RAG需深入垂直领域,解决行业特有痛点。2025年,医疗、金融、教育等领域的定制化RAG将成为增长点。
精通 RAG:打造顶尖企业级 RAG 系统的秘籍:
技术细节:
应用场景:
挑战与解决方案:
实践建议:
2025年,RAG将彻底告别“独立明星”地位,成为智能体生态中的关键组件。其发展将围绕以下核心趋势展开:
“RAG已死,RAG万岁!”RAG完成了从技术热点到生态子模块的转型,2025年将在Agent融合、多模态、行业定制化等领域迎来新机遇。通过体系化思考和实践,RAG将继续推动智能应用的落地,创造更智能、更个性化的未来。让我们携手探索,迎接RAG的新篇章!
文章来自于“阿东玩AI”,作者“阿东”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0