长文本处理方法、装置、设备及介质

申请号：CN202510031301

申请日期：2025-01-08

公开号：CN119990136A

公开日期：2025-05-13

类型：发明专利

摘要

本申请实施例提供一种长文本处理方法、装置、设备及介质。该方法包括：对待处理的长文本进行分词，得到token序列。该token序列中包括多个token；采用预先获取的语言处理模型对token序列进行预测处理，得到处理后的token序列；所述处理后的token序列中包括所述token序列以及所述token序列后的至少一个预测token；所述语言处理模型的注意力层是基于状态空间模型SSM和自注意力机制融合得到的，所述SSM用于获取输入的token的全局注意力，所述自注意力机制用于获取输入的token的局部注意力。该方法在对长文本进行建模时，用以达到在降低模型的计算复杂度的同时，确保模型文本建模的语义完整性和连贯性的效果。

技术关键词

文本处理方法注意力机制序列计算机执行指令状态空间模型文本处理装置可读存储介质分词处理单元处理器存储器复杂度电子设备字符语义

系统为您推荐了相关专利信息

一种遥感影像分割方法、装置、介质和设备

遥感影像分割方法局部特征提取注意力机制卷积特征强化特征

一种基于Transformer的综合特征网络流量分类方法

网络流量分类方法网络流量数据门控循环单元前馈神经网络卷积模块

一种越野路面分类方法及系统

越野路面矩阵车辆CAN总线行驶特征分类方法

跟网-构网型混合电力系统宽频振荡特性解析方法、装置、设备及存储介质

混合电力系统特性解析方法有功功率模式支路

一种基于图像识别的手写内容认证方法、系统及电子设备

内容认证方法栅格化算法卷积神经网络模型非暂态计算机可读存储介质图像