长文本的标签分类方法、装置、设备、存储介质及产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
长文本的标签分类方法、装置、设备、存储介质及产品
申请号:CN202411940628
申请日期:2024-12-26
公开号:CN119782531A
公开日期:2025-04-08
类型:发明专利
摘要
本申请公开了一种长文本的标签分类方法、装置、设备、存储介质及产品,涉及计算机技术领域,公开了长文本的标签分类方法,包括:获取待分类文本;基于所述待分类文本,通过预设的大语言模型进行标签分类处理,得到标签分类结果。本申请中大语言模型通过位置编码将待分类文本转换为文本序列向量,再利用多头自注意力机制并行计算文本序列向量间的相关性,也即大语言模型能够并行处理文本序列向量,以此提高大语言模型的显存利用率,而显存利用率的提高能够实现大语言模型处理更多字符的长文本,也即大语言模型无需对长文本进行分割,从而避免分割所导致的语义丢失,进而提高长文本的标签分类准确性。
技术关键词
标签分类方法 文本 大语言模型 注意力机制 梯度下降算法 矩阵 误差 计算机程序产品 字符 信息编码 语义 序列 更新模型参数 分类设备 分段 特征值 处理器
系统为您推荐了相关专利信息
人脸活体检测方法 语义特征 反射特征 判别特征 深层特征提取
可信执行模块 会计 财务 账簿 报表
文本 网站检测方法 语义 网站检测装置 站点
价格预测方法 价格趋势预测 数据 情绪分析方法 文本
自动优化方法 模板 大语言模型 应用程序编程接口 演化策略