一种融合多视图信息与自监督学习的蛋白质功能预测方法
申请号:CN202411932936
申请日期:2024-12-26
公开号:CN119889452A
公开日期:2025-04-25
类型:发明专利
摘要
本发明提供了一种融合多视图信息与自监督学习的蛋白质功能预测方法,获得蛋白质序列特征。利用直接生成方法和深度学习方法生成蛋白质接触图,将蛋白质接触图通过图卷积模型生成蛋白质结构特征。将蛋白质序列特征和蛋白质结构特征通过对比式自监督学习和生成式自监督学习进行特征提取。最小化对比式自监督学习损失函数和生成式自监督学习损失函数。将最终更新得到的蛋白质序列特征和蛋白质结构特征进行拼接,再经过多层感知机进行蛋白质功能预测。本发明的技术方案克服现有技术中部分蛋白质分子只能获得其序列信息而无法获得结构信息,能应用于药物靶点亲和预测的蛋白质三维结构数据量较少的问题。
技术关键词
蛋白质功能预测方法
序列特征
BiLSTM模型
深度学习方法
卷积模型
蛋白质三维结构
多层感知机
变量
代表
生成方法
噪声
参数
矩阵
关系
编码
元素
分子
药物