基于强化学习的RAG系统评估数据集自动合成方法和装置

申请号：CN202511094625

申请日期：2025-08-06

公开号：CN120596663B

公开日期：2026-01-02

类型：发明专利

摘要

本申请涉及一种基于强化学习的RAG系统评估数据集自动合成方法和装置，其中，该方法包括：获取RAG系统的知识库数据，并从知识库数据中提取目标垂直领域的关键词和相关的文档；根据关键词和文档，利用预设的提示词模版合成初始问答对；构建初始问答对的奖励；根据关键词、初始问答对、奖励以及初始策略模型的参数，确定初始策略模型的训练数据；并基于训练数据，对初始策略模型进行训练，得到目标策略模型；利用目标策略模型，基于关键词和文档批量生成满足奖励的目标问答对，通过本申请，解决了相关技术中评估数据集合成的成本高，效率低下，影响评估RAG系统有效性的问题，能够降低合成成本，提高合成效率。

技术关键词

自动合成方法策略关键词提取模型自动合成装置批量模块程度可控模版数据格式处理器计算机设备参数可读存储介质存储器有效性切块

系统为您推荐了相关专利信息

一种门户公告敏感词自动巡检方法及系统

巡检日志自动巡检方法加密数据自动巡检系统 AC自动机

一种便携式单兵智能反无人机设备及操作方法

反无人机设备便携式单兵子模块干扰信号发生器信号监测模块

一种基于VGP和SU的差分隐私随机梯度下降方法

随机梯度下降差分隐私更新模型参数样本深度学习技术

一种水电站励磁系统故障数据生成方法、装置

水电站励磁数据生成方法局部搜索策略励磁系统参数

根据物料粘度控制风机功率的方法、装置、设备及介质

预测控制模型模型预测控制方法调节风机功率卡尔曼滤波可执行程序代码