摘要
本发明提供一种基于大模型的数据分类分级方法及系统,在大模型的调试阶段,基于基础政务文本分类模型挖掘政务训练文本的文本表征数组,在全连接网络的连接影响变量中获取先验真实分类的第一质心数组表示和其余分类的第二质心数组表示,修正文本表征数组和第二质心数组表示之间的第一余弦相似度,获得大于第一余弦相似度的目标余弦相似度,依据目标余弦相似度、文本表征数组、第一质心数组表示、第二质心数组表示和第二余弦相似度确定距离代价值,以此修正模型的模型参变量,获得目标政务文本分类模型。本发明可以增加政务文本分类模型对分类界限不清晰、分类困难复杂训练文本的训练质量,提高目标政务文本分类模型对政务文本的分类精度。