基于信息压缩与剪枝的RAG数据库构建方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于信息压缩与剪枝的RAG数据库构建方法
申请号:CN202510017185
申请日期:2025-01-06
公开号:CN120045634B
公开日期:2025-10-28
类型:发明专利
摘要
本发明提出了一种信息压缩与剪枝的RAG数据库构建方法,实现步骤为:构建节点对象和层次化聚类树;对聚类树中的节点对象文本信息进行压缩;基于类QR分解方法对部分节点对象文本信息压缩后的聚类树进行剪枝。本发明通过对聚类树中子节点中的句子单元文本信息进行压缩并对所压缩的子节点的嵌入向量进行更新,能够根据大语言模型的实际需求,筛选并存储最有价值的外部信息,这不仅减少了RAG数据库中无效数据存储,还确保RAG数据库中存储的文本信息始终具有增益性,同时基于类QR分解方法对部分节点对象文本信息压缩后的聚类树进行剪枝,有效识别并删除语义相似度较高的冗余子节点对象,减小了RAG数据库中节点对象的存储开销。
技术关键词
节点 文本 数据库构建方法 对象 QR分解方法 大语言模型 语义 聚类 标识符 级联 度量 模板 注意力 更新方法 编码器 线性 数据存储 网络 中子