摘要
本发明提出一种基于曼巴模型与半监督学习的RNA序列分类方法,属于生物信息学领域。首先,对RNA序列提取多尺度稀疏特征,并通过编码器网络将高维特征压缩至低维潜在空间向量,同时进行L2归一化以增强特征可分性。其次,在残差结构中引入基于选择性状态空间模型的曼巴模型,以低复杂度高效建模长程依赖关系。最后通过构建编码器‑解码器结构,实现无监督特征重建与有监督分类的半监督学习,并采用加权损失函数提升模型在小样本条件下的泛化性能。实验结果表明,本方法在多类RNA序列分类任务中显著提升了F1分数。本发明降低了长序列建模和标注的成本,适用于RNA功能预测、生物医学研究及疾病诊断等领域。