一种基于扩散对齐的大模型检索增强生成方法和系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于扩散对齐的大模型检索增强生成方法和系统
申请号:CN202411819577
申请日期:2024-12-11
公开号:CN119988596B
公开日期:2025-11-28
类型:发明专利
摘要
公开了一种基于扩散对齐的大模型检索增强生成方法和系统,包括获取用户输入的文本信息,并采用向量模型对文本信息进行编码,得到编码后的语义向量;从向量数据库中检索与编码语义向量相似的文本信息,并根据相似度阈值选择符合条件的文本信息;对符合条件的文本信息进行实体抽取,将提取的实体信息与图数据库中存储的实体关系进行索引,生成包含额外语义信息的增强背景信息;将增强背景信息从原始词向量空间扩散到大语言模型的词向量空间,得到与语言模型语义分布一致的扩散偏移向量;将扩散偏移向量与用户输入文本信息的编码向量进行拼接,输入大语言模型进行推理,输出包含检索增强信息的生成结果。本申请可大幅提高推理速度。
技术关键词
语义向量 实体 编码向量 文本 生成方法 生成系统 代表 多头注意力机制 大语言模型 网络结构 扩散结构 残差结构 信息编码 索引 序列 定义 关系 超参数
系统为您推荐了相关专利信息
数据集构建方法 多模态交互 数学 输入命令 知识点
深度神经网络 信息处理方法 双向长短期记忆网络 递归神经网络模型 Word2Vec模型
生成方法 图像内容分类 语言识别技术 法律知识图谱 计算机程序产品
命名实体识别 三元组 大语言模型 节点 语句
信息采集功能 智能客服 意图识别模型 答案 运营方法