长文本的标签分类方法、装置、设备、存储介质及产品

申请号：CN202411940628

申请日期：2024-12-26

公开号：CN119782531A

公开日期：2025-04-08

类型：发明专利

摘要

本申请公开了一种长文本的标签分类方法、装置、设备、存储介质及产品，涉及计算机技术领域，公开了长文本的标签分类方法，包括：获取待分类文本；基于所述待分类文本，通过预设的大语言模型进行标签分类处理，得到标签分类结果。本申请中大语言模型通过位置编码将待分类文本转换为文本序列向量，再利用多头自注意力机制并行计算文本序列向量间的相关性，也即大语言模型能够并行处理文本序列向量，以此提高大语言模型的显存利用率，而显存利用率的提高能够实现大语言模型处理更多字符的长文本，也即大语言模型无需对长文本进行分割，从而避免分割所导致的语义丢失，进而提高长文本的标签分类准确性。

技术关键词

标签分类方法文本大语言模型注意力机制梯度下降算法矩阵误差计算机程序产品字符信息编码语义序列更新模型参数分类设备分段特征值处理器

系统为您推荐了相关专利信息

一种基于双重辅助监督的轻量化人脸活体检测方法及系统

人脸活体检测方法语义特征反射特征判别特征深层特征提取

一种基于联邦学习与可信计算的跨境会计合规处理系统

可信执行模块会计财务账簿报表

网站检测方法、装置、电子设备和存储介质

文本网站检测方法语义网站检测装置站点

基于数据融合的金融交易情绪分析与价格趋势预测方法

价格预测方法价格趋势预测数据情绪分析方法文本

提示模板自动优化方法、装置及存储介质

自动优化方法模板大语言模型应用程序编程接口演化策略