摘要
本发明涉及一种基于多组学数据融合的肺癌预后预测方法,包括:获取肺癌患者的多组学数据和生存数据,并对每个肺癌患者的多组学数据进行预处理;将每个肺癌患者的多组学数据进行拼接得到每个训练样本的多组学集成特征矩阵;通过自编码器将训练样本的多组学集成特征矩阵映射到低维空间得到训练样本的多组学低维特征矩阵;根据肺癌患者的生存数据利用弹性网络和装袋思想结合的VSOEnetbag算法对训练样本的多组学低维特征矩阵进行特征选择得到训练样本的显著表达特征矩阵;根据训练样本的显著特征表达矩阵使用K‑means聚类,对训练样本进行风险亚型聚类,得到亚型聚类结果;将训练样本的亚型聚类结果作为标签,将肺癌患者的RNA‑Seq表达谱数据作为自变量构建基于多变量的cox预后模型;将待测肺癌患者的RNA‑Seq表达谱数据输入基于多变量的cox预后模型,得到肺癌患者的预后结果。