摘要
本发明涉及一种基于DL‑GapFilling模型的gap填充方法。包括如下步骤:1:步骤1:使用传统工具对原始基因组进行预组装,生成sacffold文件,得到组装结果1;2:使用DFillingNet模型网络对数据集进行深度学习,并采用BeamStar Contraction‑Expansion Algorithm(BSCEA)算法对gap序列进行预测,然后将预测基因序列与原始基因组一并进行基因组装,得到组装结果2;3:使用Quast,Exonerate等将组装结果1,2比对到参考基因组,通过构建针对预测序列筛选优化的PredictionFilter机制,优化步骤2产生的预测序列。最终将筛选后的预测序列与原始基因组进行基因组装。本发明为传统软件提供了新的预测序列,提出了针对基因序列的PredictionFilter机制,提高了传统软件的gap填充率和正确率。