摘要
本发明提出一种基于语义感知对比学习的癌症单细胞聚类方法,通过筛选高表达基因,并随机屏蔽每个细胞的基因表达,生成细胞数据的两种增强;利用自动编码器从视图中提取语义信息,并通过最小化重构损失对编码器进行训练;根据不同视图,分别构建细胞‑细胞图和伪标签图;应用双重对比对齐模块,通过利用生成的伪标签图中的语义信息来捕获增强中的语义不变表示。本申请通过将相似性图与高置信度伪标签图对齐来确保这些增强共享一致的语义结构,保持了单元间关系与可靠的类信息的结构一致性,实现了语义不变单元表示的有效学习,且有效对癌症单细胞数据的语义信息提取和聚类,提高模型的鲁棒性和聚类效果。