一种基于双向长短期记忆网络的蛋白质残基B-factor预测模型构建方法
申请号:CN202410838182
申请日期:2024-06-26
公开号:CN118866111A
公开日期:2024-10-29
类型:发明专利
摘要
本发明属于蛋白质结构计算领域,具体涉及一种基于双向长短期记忆网络的蛋白质残基B‑factor预测模型构建方法,包括:对用于构建训练样本的每种蛋白质序列进行切割,对应获得序列片段集;提取每个序列片段中每个残基的四种序列特征和五种结构特征,并将两种特征拼接作为该残基的特征向量;将每个序列片段中各残基的特征向量拼接构成该序列片段的特征矩阵,将位于每个序列片段中心位置处的残基作为待预测残基,每个序列片段的特征矩阵和对应待预测残基的B‑factor构成一个训练样本;采用训练样本集训练深度神经网络模型,得到蛋白质B‑factor预测模型,深度神经网络模型包括BiLSTM。本发明能提高预测精度。
技术关键词
预测模型构建方法
双向长短期记忆网络
训练深度神经网络
深度神经网络模型
训练样本集
序列特征
矩阵
隐马尔可夫模型
可读存储介质
计算机程序产品
处理器
编码向量
分辨率
晶体
存储器
标签
电子设备