摘要
本申请公开了一种长文本的标签分类方法、装置、设备、存储介质及产品,涉及计算机技术领域,公开了长文本的标签分类方法,包括:获取待分类文本;基于所述待分类文本,通过预设的大语言模型进行标签分类处理,得到标签分类结果。本申请中大语言模型通过位置编码将待分类文本转换为文本序列向量,再利用多头自注意力机制并行计算文本序列向量间的相关性,也即大语言模型能够并行处理文本序列向量,以此提高大语言模型的显存利用率,而显存利用率的提高能够实现大语言模型处理更多字符的长文本,也即大语言模型无需对长文本进行分割,从而避免分割所导致的语义丢失,进而提高长文本的标签分类准确性。