数据处理方法、装置、设备、计算机程序产品和存储介质
申请号:CN202411124919
申请日期:2024-08-15
公开号:CN119005335B
公开日期:2025-04-15
类型:发明专利
摘要
提供了一种数据处理方法、装置、设备、计算机程序产品和计算机可读存储介质。该方法结合文本序列的具体场景类别和需求,利用与该场景类别相关联的不同类别的多个隐藏状态来对文本序列的历史词元序列进行编码,基于新生成的词元对多个隐藏状态进行实时更新,从而基于更新的多个隐藏状态来生成新的词元。该方法能够利用多个隐藏状态来编码历史词元序列,使得能够通过其数据压缩能力来高效生成长文本序列,减少了显存需求和计算开销,同时避免了因数据过度压缩而可能导致的生成质量下降的问题。通过结合文本序列的具体场景类别和需求来编码多个隐藏状态,使得模型能够提升对于文本数据的结构和逻辑关系的理解,从而实现更准确和可靠的模型推理。
技术关键词
状态空间模型
文本
场景类别
序列
计算机可执行程序
计算机程序产品
数据处理方法
可读存储介质
编码
计算机可执行指令
数据处理设备
多任务
医疗场景
数据处理装置
数据获取模块
处理器
数据压缩
状态更新
计算机设备