基于多分子模态融合的通用蛋白质-RNA结合预测方法
申请号:CN202411865016
申请日期:2024-12-18
公开号:CN119811500B
公开日期:2025-10-31
类型:发明专利
摘要
一种基于多分子模态融合的通用蛋白质‑RNA结合预测方法,通过广义生物学基础模型对经预处理的蛋白质与RNA序列进行初始表征后,用于训练构造得到的基于改进交叉注意力机制的神经网络模型,在在线阶段采用训练后的模型根据任意输入的蛋白质序列与RNA分子序列输出对两分子序列结合可能性的预测值。本发明使用通用生物学基础模型为蛋白质与RNA两种分子进行初始表征,通过改进的交叉注意力机制对两种分子的表征进行有效信息的提取与融合,基于有效融合信息训练后的人工神经网络可以更加准确的预测蛋白质与RNA结合结果,并且具有更为强大的泛化能力,能够应对多类蛋白的结合预测场景与任务。
技术关键词
交叉注意力机制
分子
多层感知机
神经网络模型
序列
蛋白
样本
滑动窗口方法
动态权重分配
染色体
训练集
人工神经网络
非线性特征
标签
模态特征
信号
模块
融合特征