基于原始电流和注意力模型的Nanopore测序数据纠错方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于原始电流和注意力模型的Nanopore测序数据纠错方法
申请号:CN202411013200
申请日期:2024-07-26
公开号:CN118887999A
公开日期:2024-11-01
类型:发明专利
摘要
本发明公开了一种基于原始电流和注意力模型的Nanopore测序数据纠错方法。本发明包含以下步骤:首先,根据Nanopore原始测序数据进行比对后,获取Nanopore原始测序数据中所有碱基序列的错误碱基信息和正确碱基信息;结合滑动窗口对所有碱基序列进行特征提取后,获得各碱基序列对应的错误碱基特征集合,进而构建训练样本集;接着训练并获得不同模式的预测模型,最后对待测碱基序列预处理后再输入到预测模型并获得预测结果,根据获得的预测结果对待测碱基序列纠正。本发明通过引入Transformer模型对纳米孔测序数据进行纠错,充分利用原始电流信号中的信息,提升测序数据的准确性和可靠性。
技术关键词
数据纠错方法 注意力模型 滑动窗口 原始测序数据 序列 前馈神经网络 多头注意力机制 二分类模型 电流 训练样本集 编码特征 模式 纳米孔 计算机设备 分类器 存储器 处理器 线性