摘要
本发明公开了一种模态缺失场景下的基因多组学数据融合方法,涉及涉及生物信息学领域,包括对样本的每种组学数据分别进行预处理和特征筛选;采用非负矩阵分解算法获取样本的公共潜在表示,再基于公共潜在表示之间的余弦相似度构建超边;利用原型网络层和线性层提取组学数据特征,作为超图节点;通过超图信息传播机制聚合相似样本信息,在潜在空间中插补缺失模态,并融合现有模态和辅助信息以增强表示学习效果;将插补和增强后的特征表示输入多模态学习模块,进行多模态数据融合与预测结果输出。本发明基于超图神经网络的缺失模态补全方法,将深度学习技术与基因多组学领域的知识相结合,从而实现数据降噪、缺失模态补全和高效预测等目标。