摘要
本发明提供了一种多模态蛋白质功能预测方法及预测系统,所述预测方法包括如下步骤:将蛋白质序列数据经过一维卷积层和池化层处理,提取蛋白质序列中的局部依赖特征,捕捉蛋白质中的模式和关键序列特征;以蛋白质序列数据作为输入,使用大规模预训练蛋白质语言模型提取蛋白质序列中残基级别的嵌入信息作为节点特征应用于接触图;以蛋白质序列数据作为输入,基于Cb‑Cb距离预测蛋白质残基之间接触的概率,构建接触图;使用多头注意力机制和残差结构对不同模态的特征进行联合处理,通过特征融合整合来自不同模态的数据,融合提取到的所述关键序列特征、所述残基级别嵌入信息和所述接触图。本发明的预测方法预测准确,性能好。