自然语言处理模型优化方法、装置、设备、存储介质及产品
申请号:CN202410711941
申请日期:2024-06-03
公开号:CN118606449A
公开日期:2024-09-06
类型:发明专利
摘要
本发明公开了一种自然语言处理模型优化方法、装置、设备、存储介质及计算机程序产品,该方法包括:获取第一样本集,第一样本集中的样本为未标记的样本;通过大型语言模型LLM对第一样本集中的样本进行标记,得到第二样本集;根据第二样本集以及预先标记的训练样本集对第一自然语言处理NLP模型进行调整,得到第二NLP模型。通过使用LLM对未标记的第一样本集中的样本进行标记,得到第二样本集,然后根据第二样本集以及预先标记的训练样本集对NLP模型进行调整,得到第二NLP模型。无需数据集的采集和大量人工标注的投入,也能够对NLP模型进行优化,增加其泛化能力,提高NLP模型执行NLP任务时的准确率。
技术关键词
自然语言
模型优化方法
标记
计算机程序产品
语义
分类器
训练样本集
优化设备
处理器
偏差
优化装置
存储器
模块
数据