大语言模型的训练方法、文本查询方法及其装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大语言模型的训练方法、文本查询方法及其装置
申请号:CN202510112818
申请日期:2025-01-23
公开号:CN120045666A
公开日期:2025-05-27
类型:发明专利
摘要
本公开提供了一种大语言模型的训练方法、文本查询方法及其装置,涉及人工智能领域,尤其涉及深度学习、自然语言处理、大模型领域。具体实现方案为:确定样本查询文本,以及,从预设的索引池中匹配得到与样本查询文本相关的至少一个提示样本集合,其中,索引池包括多个候选样本集合,候选样本集合中包括正样本和负样本;将提示样本集合和样本查询文本共同输入待训练的大语言模型,得到样本回答文本;获取样本回答文本的准确性相关参数,并根据准确性相关参数对索引池进行更新;基于更新后的索引池对大语言模型进行增量训练,得到训练后的目标大语言模型。
技术关键词
样本 大语言模型 索引 文本查询方法 匹配模块 参数 查询装置 标签 计算机程序产品 算法 训练装置 处理器通信 频率 自然语言 指令 可读存储介质