摘要
本发明提供了一种基于分布与知识对齐的单细胞多组学细胞类型注释方法,属于单细胞类型注释技术领域,该方法包括获取单细胞转录组数据和单细胞染色质可及性测序数据,并对多组学变分自编码器模型进行预训练及训练,其中,多组学变分自编码器模型结合变分自编码器和知识蒸馏技术,通过分布与知识对齐整合和注释多组学单细胞数据。利用已训练的多组学变分自编码器模型对同时输入的单细胞转录组数据和单细胞染色质可及性测序数据进行细胞类型预测。本发明解决了仅依赖单一组学的方法的局限性问题,增强组学之间的协同作用,提升了注释的准确性,以及通过知识蒸馏,减少了计算开销。