摘要
本发明提供一种基于扩散模型的单细胞跨模态数据转换方法及设备,属于生物信息学技术领域。包括:搭建基于扩散模型的单细胞跨模态数据转换模型,以单细胞RNA和ATAC为例,由编码器Er、编码器Ea、解码器Dr、解码器Da、RNA扩散转换模型、ATAC扩散转换模型组成;数据预处理及自编码器预训练,优化各编码器、解码器参数并冻结参数;利用ATAC和RNA数据训练单细胞跨模态数据转换模型,包括ATAC转换RNA过程及RNA转换ATAC过程,利用Unet网络更新用于预测RNA噪声的神经网络参数和用于预测ATAC噪声的神经网络参数,通过反向优化来最小化预测噪声与采样噪声之间的差异,训练结束后停止更新模型参数;利用单细胞跨模态数据转换模型进行单细胞跨模态数据生成。