基于强化学习的RAG系统评估数据集自动合成方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于强化学习的RAG系统评估数据集自动合成方法和装置
申请号:CN202511094625
申请日期:2025-08-06
公开号:CN120596663B
公开日期:2026-01-02
类型:发明专利
摘要
本申请涉及一种基于强化学习的RAG系统评估数据集自动合成方法和装置,其中,该方法包括:获取RAG系统的知识库数据,并从知识库数据中提取目标垂直领域的关键词和相关的文档;根据关键词和文档,利用预设的提示词模版合成初始问答对;构建初始问答对的奖励;根据关键词、初始问答对、奖励以及初始策略模型的参数,确定初始策略模型的训练数据;并基于训练数据,对初始策略模型进行训练,得到目标策略模型;利用目标策略模型,基于关键词和文档批量生成满足奖励的目标问答对,通过本申请,解决了相关技术中评估数据集合成的成本高,效率低下,影响评估RAG系统有效性的问题,能够降低合成成本,提高合成效率。
技术关键词
自动合成方法 策略 关键词提取模型 自动合成装置 批量 模块 程度可控 模版 数据格式 处理器 计算机设备 参数 可读存储介质 存储器 有效性 切块
系统为您推荐了相关专利信息
巡检日志 自动巡检方法 加密数据 自动巡检系统 AC自动机
反无人机设备 便携式单兵 子模块 干扰信号发生器 信号监测模块
随机梯度下降 差分隐私 更新模型参数 样本 深度学习技术
水电站励磁 数据生成方法 局部搜索策略 励磁系统 参数
预测控制模型 模型预测控制方法 调节风机功率 卡尔曼滤波 可执行程序代码