一种基于检索增强生成的端到端的大模型微调方法和系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于检索增强生成的端到端的大模型微调方法和系统
申请号:CN202411581799
申请日期:2024-11-07
公开号:CN119719268A
公开日期:2025-03-28
类型:发明专利
摘要
本发明提出一种基于检索增强生成的端到端的大模型微调方法和系统,包括:读取用户历史问题的文本信息;利用分词器模型的语义提取模块对文本信息进行深层语义抽取得到关键语义输出;从数据库中获取编码后的语义向量,利用BGE检索模型和利用M3E向量模型对深层语义信息进行编码并召回相似信息,将两路召回后的向量语义信息进行合并;分别计算深度语义信息向量和文本信息向量在语义空间中与目标向量的KL散度,选取代价较小的输入到审查模块;将偏好数据利用DPO算法对模型进行训练,得到符合人类偏好的模型。该方法得到的微调后的模型在推理的过程中无需经过预处理,缓解因检索不精确而导致的模型幻觉,毒性等问题。
技术关键词
微调方法 语义向量 文本 模块 微调系统 编码向量 数据 时间序列模型 前馈神经网络 词性信息 融合策略 处理器 人类 算法 样本 存储装置 可读存储介质