基于Transformer的纳米孔测序信号识别方法及系统
申请号:CN202510997684
申请日期:2025-07-19
公开号:CN120873389A
公开日期:2025-10-31
类型:发明专利
摘要
本发明适用于基因测序技术领域,提供了基于Transformer的纳米孔测序信号识别方法及系统,方法包括:对纳米孔测序信号进行归一化处理,分割为固定长度的信号窗口;通过包含卷积层和多头自注意力模块的Transformer编码器提取信号特征;采用自回归Transformer解码器,结合信号特征与已解码碱基序列的上下文信息,通过交叉注意力机制生成当前碱基的预测概率;基于波束搜索算法迭代生成最优碱基序列,结合键值缓存优化解码效率;对分段解码结果进行重叠区域融合与质控,输出最终序列。本发明显著提升纳米孔测序在复杂生物序列分析中的精度与可靠性,在多种基因测序数据集上的识别准确率超过现有基于CTC的模型。
技术关键词
信号识别方法
纳米孔
信号特征
交叉注意力机制
信号识别系统
解码器
序列
搜索算法
编码器模块
采样模块
键值
基因测序数据
信号预处理模块
基因测序技术
数模转换
损失函数优化