大语言模型的训练方法、文本查询方法及其装置

申请号：CN202510112818

申请日期：2025-01-23

公开号：CN120045666A

公开日期：2025-05-27

类型：发明专利

摘要

本公开提供了一种大语言模型的训练方法、文本查询方法及其装置，涉及人工智能领域，尤其涉及深度学习、自然语言处理、大模型领域。具体实现方案为：确定样本查询文本，以及，从预设的索引池中匹配得到与样本查询文本相关的至少一个提示样本集合，其中，索引池包括多个候选样本集合，候选样本集合中包括正样本和负样本；将提示样本集合和样本查询文本共同输入待训练的大语言模型，得到样本回答文本；获取样本回答文本的准确性相关参数，并根据准确性相关参数对索引池进行更新；基于更新后的索引池对大语言模型进行增量训练，得到训练后的目标大语言模型。

技术关键词

样本大语言模型索引文本查询方法匹配模块参数查询装置标签计算机程序产品算法训练装置处理器通信频率自然语言指令可读存储介质