长文本处理方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
长文本处理方法、装置、设备及介质
申请号:CN202510031301
申请日期:2025-01-08
公开号:CN119990136A
公开日期:2025-05-13
类型:发明专利
摘要
本申请实施例提供一种长文本处理方法、装置、设备及介质。该方法包括:对待处理的长文本进行分词,得到token序列。该token序列中包括多个token;采用预先获取的语言处理模型对token序列进行预测处理,得到处理后的token序列;所述处理后的token序列中包括所述token序列以及所述token序列后的至少一个预测token;所述语言处理模型的注意力层是基于状态空间模型SSM和自注意力机制融合得到的,所述SSM用于获取输入的token的全局注意力,所述自注意力机制用于获取输入的token的局部注意力。该方法在对长文本进行建模时,用以达到在降低模型的计算复杂度的同时,确保模型文本建模的语义完整性和连贯性的效果。
技术关键词
文本处理方法 注意力机制 序列 计算机执行指令 状态空间模型 文本处理装置 可读存储介质 分词 处理单元 处理器 存储器 复杂度 电子设备 字符 语义
系统为您推荐了相关专利信息
遥感影像分割方法 局部特征提取 注意力机制 卷积特征 强化特征
网络流量分类方法 网络流量数据 门控循环单元 前馈神经网络 卷积模块
越野路面 矩阵 车辆CAN总线 行驶特征 分类方法
混合电力系统 特性解析方法 有功功率 模式 支路
内容认证方法 栅格化算法 卷积神经网络模型 非暂态计算机可读存储介质 图像