生成多轮对话语料以及训练、测试大语言模型的方法

申请号：CN202510285984

申请日期：2025-03-11

公开号：CN120216640A

公开日期：2025-06-27

类型：发明专利

摘要

本申请提供一种生成多轮对话语料以及训练、测试大语言模型的方法、装置、设备，其中所述生成多轮对话语料的方法包括：获取第一提问信息；对第一提问信息进行向量化处理，得到第一提问向量；从存储有多组数据对的向量数据库中查询与第一提问向量的相似度满足预设相似度条件的目标上文向量；任一组数据对，均包括根据用户在与语言模型的历史交互过程中的提问上文生成的上文向量，以及历史交互过程中的提问下文；基于目标上文向量对应的提问下文，得到问题生成约束信息；调用大语言模型以问题生成约束信息作为约束条件生成第一提问信息之后的第二提问信息；基于第一提问信息和所述第二提问信息，生成多轮对话语料。

技术关键词

多轮对话大语言模型序列字符生成提示信息处理器通信存储器数据模型训练模块指令表达式测试模块分词