一种基于多视图聚类的检索增强生成方法和系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多视图聚类的检索增强生成方法和系统
申请号:CN202410853239
申请日期:2024-06-28
公开号:CN118394946B
公开日期:2024-08-23
类型:发明专利
摘要
本申请涉及一种基于多视图聚类的检索增强生成方法和系统。所述方法包括:构建图谱数据库、向量数据库和ES数据库;将图谱数据库、向量数据库和ES数据库中的数据进行多视图预处理得到多视图特征数据库,对用户输入的多视图特征和多视图特征数据库中的数据进行多视图聚类得到多个聚类簇和每一数据点的软聚类分数;选取与用户输入属于同一聚类簇的数据点放入候选池,对候选池中的每一数据点对应的原始数据进行多路召回得到召回结果;根据软聚类分数对召回结果进行融合重排得到重排结果,将重排结果和用户输入加载到提示词后输入大语言模型,输出对应的回答。采用本方法能够在保证检索效率的前提下进一步提高检索精度,实现高效文档检索。
技术关键词
特征数据库 图谱 关键字 文本 大语言模型 聚类 生成方法 编码 链接特征 词袋模型 排序模型 模块 嵌入特征 重构 生成系统 拉链 三元组 语义 实体