大语言模型评估集自动生成方法、装置、设备和介质

申请号：CN202510546457

申请日期：2025-04-28

公开号：CN120632385A

公开日期：2025-09-12

类型：发明专利

摘要

本申请提供一种大语言模型评估集自动生成方法、装置、设备和介质：采用检索增强生成的方式搜索与关键词相关的专业文档，自动从检索到的内容中分析得出关键问题并给出答案，无需人工输入原始问题作为启动条件，减少人工成本，降低生成难度，同时能够利用调度领域大规模无标注语料，提升对专业领域知识考察的覆盖度。在问题不合适时能够批量生成新的问题数据而非改写原始问题，进一步提升问题多样性。问题数据的生成过程以关键词形式的知识点为基础，保证题目主题准确且聚焦，避免大语言模型生成的随机性。在输入关键词后，能够以自动化手段批量生成评估集，为调度大模型训练和微调过程中的能力评估提供基准，提升模型开发测试效率。

技术关键词

自动生成方法大语言模型关键词答案生成装置项目生成技术模版模块数据存储文本专业组装单元解析单元计算机处理器知识点批量

系统为您推荐了相关专利信息

一种风险因素识别方法、装置及电子设备

语句文本识别方法数字孪生水利系统

自主游戏操作AI代理方法与装置

控制权视频流同步画面大语言模型意图

三维虚拟场景的生成方法、装置、设备及存储介质

三维虚拟场景特征描述信息校正策略生成方法融合深度图像

一种基于AIGC的装修方案生成系统

生成系统关键词模型训练模块输入模块图像搜索引擎

基于大语言模型的智能体构建方法及系统、设备、介质

大语言模型体构建方法摘要标签文档分类