一种基于三代测序数据和泛基因组的结构变异检测算法、系统、设备及介质
申请号:CN202510185062
申请日期:2025-02-19
公开号:CN120048341A
公开日期:2025-05-27
类型:发明专利
摘要
本发明公开了一种基于三代测序数据和泛基因组的结构变异检测算法、系统、设备及介质,检测算法包括:检测泛基因组图中的snarl结构,从gam比对文件中提取每个snarl路径对应的reads;计算每个snarl路径中所有边的平均覆盖度大小,和覆盖度为0的边的数目;统计每个snarl中可能包含的路径、路径方向、比对到路径上的reads信息以及路径覆盖度信息;根据reads信息和路径覆盖度信息,筛选最优路径和第二路径;将优化后的最优路径与第二路径,均和参考路径进行比较,得出变异信息。本发明将路径对应的reads信息、路径的碱基覆盖度信息和路径的边的覆盖度信息融合起来,作为潜在变异路径选择的依据,提高了三代测序数据检测的准确性。
技术关键词
变异检测算法
算法结构
数据
节点
可读存储介质
处理器
序列
模块
存储器
计算机
电子设备