摘要
本发明公开了一种蛋白质和RNA结合亲和力的预测方法及系统,属于生物信息学技术领域。该方法包括以下步骤:首先获取蛋白质和RNA的原始氨基酸序列及核苷酸序列的高维嵌入向量和三维结构;利用Graph Transformer模型构建蛋白质图并整合序列与结构特征,得到蛋白质综合特征向量;通过注意力机制融合RNA的序列与结构特征,生成RNA核苷酸综合结构特征向量;采用互注意力模型对蛋白质和RNA特征进行交互学习,得到全局交互亲和力得分矩阵;根据交互矩阵确定蛋白质和RNA各部分的注意力权重,构建联合特征向量;最后通过多层感知机预测蛋白质与RNA的结合亲和力。本发明通过深度融合多模态信息,显著提升了预测的准确性和泛化能力,适用于药物筛选和生物学机制研究。