基于原始电流和注意力模型的Nanopore测序数据纠错方法
申请号:CN202411013200
申请日期:2024-07-26
公开号:CN118887999A
公开日期:2024-11-01
类型:发明专利
摘要
本发明公开了一种基于原始电流和注意力模型的Nanopore测序数据纠错方法。本发明包含以下步骤:首先,根据Nanopore原始测序数据进行比对后,获取Nanopore原始测序数据中所有碱基序列的错误碱基信息和正确碱基信息;结合滑动窗口对所有碱基序列进行特征提取后,获得各碱基序列对应的错误碱基特征集合,进而构建训练样本集;接着训练并获得不同模式的预测模型,最后对待测碱基序列预处理后再输入到预测模型并获得预测结果,根据获得的预测结果对待测碱基序列纠正。本发明通过引入Transformer模型对纳米孔测序数据进行纠错,充分利用原始电流信号中的信息,提升测序数据的准确性和可靠性。
技术关键词
数据纠错方法
注意力模型
滑动窗口
原始测序数据
序列
前馈神经网络
多头注意力机制
二分类模型
电流
训练样本集
编码特征
模式
纳米孔
计算机设备
分类器
存储器
处理器
线性