摘要
公开了一种基于扩散对齐的大模型检索增强生成方法和系统,包括获取用户输入的文本信息,并采用向量模型对文本信息进行编码,得到编码后的语义向量;从向量数据库中检索与编码语义向量相似的文本信息,并根据相似度阈值选择符合条件的文本信息;对符合条件的文本信息进行实体抽取,将提取的实体信息与图数据库中存储的实体关系进行索引,生成包含额外语义信息的增强背景信息;将增强背景信息从原始词向量空间扩散到大语言模型的词向量空间,得到与语言模型语义分布一致的扩散偏移向量;将扩散偏移向量与用户输入文本信息的编码向量进行拼接,输入大语言模型进行推理,输出包含检索增强信息的生成结果。本申请可大幅提高推理速度。