摘要
本发明公开了一种基于多模态特征和深度学习的抗菌肽定量活性预测方法,包括:S1:对抗菌肽数据集进行预处理,并将数据集划分为训练集与测试集,生成预处理后的数据集;S2:基于预处理后的数据集,利用蛋白质语言模型嵌入、BLOSUM62编码、AAIndex编码和PAAC编码四种编码方式将抗菌肽序列转化为特征向量,生成多模态特征表示;S3:基于多模态特征表示,通过深度融合特征提取模块处理BLOSUM62编码、AAIndex编码和PAAC编码的特征向量,并通过蛋白质语言特征提取模块处理蛋白质语言模型嵌入特征,生成融合特征;S4:基于融合特征,结合深度融合特征提取模块与蛋白质语言特征提取模块的输出,构建分类模型,并对新的抗菌肽序列进行活性分类,得到分类结果。