生成多轮对话语料以及训练、测试大语言模型的方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
生成多轮对话语料以及训练、测试大语言模型的方法
申请号:CN202510285984
申请日期:2025-03-11
公开号:CN120216640A
公开日期:2025-06-27
类型:发明专利
摘要
本申请提供一种生成多轮对话语料以及训练、测试大语言模型的方法、装置、设备,其中所述生成多轮对话语料的方法包括:获取第一提问信息;对第一提问信息进行向量化处理,得到第一提问向量;从存储有多组数据对的向量数据库中查询与第一提问向量的相似度满足预设相似度条件的目标上文向量;任一组数据对,均包括根据用户在与语言模型的历史交互过程中的提问上文生成的上文向量,以及历史交互过程中的提问下文;基于目标上文向量对应的提问下文,得到问题生成约束信息;调用大语言模型以问题生成约束信息作为约束条件生成第一提问信息之后的第二提问信息;基于第一提问信息和所述第二提问信息,生成多轮对话语料。
技术关键词
多轮对话 大语言模型 序列 字符 生成提示信息 处理器通信 存储器 数据 模型训练模块 指令 表达式 测试模块 分词