一种基于生成式深度学习模型的变构蛋白构象系综预测方法
申请号:CN202411002480
申请日期:2024-07-25
公开号:CN118866118A
公开日期:2024-10-29
类型:发明专利
摘要
本发明涉及一种基于生成式深度学习模型的变构蛋白构象系综预测方法,包括以下步骤:采用四元数表征蛋白质骨架;使用基于分数匹配的生成式建模学习构象数据中隐含的概率分布信息,构建蛋白质结构扩散模型,扩散模型以蛋白质序列作为输入,以采用蛋白质结构表征的变构蛋白动态构象作为输出,模型中的分数匹配网络中采用点不变注意力机制和Transformer;基于DSM损失、骨架原子的位置以及距离矩阵上的损失构建模型的损失函数,对蛋白质结构扩散模型进行训练;获取蛋白质序列,输入训练完成的蛋白质结构扩散模型,得到预测的变构蛋白构象系综。与现有技术相比,本发明实现了在骨架水平对构象进行采样,能够提供更详细的结构特征和更精确的性质估计。
技术关键词
深度学习模型
匹配网络
蛋白
注意力机制
长程相互作用
噪声
矩阵
因子
序列特征
终点
定义
数据分布
策略
样本
编码
误差
动态