基于LSTM模型的抗菌肽序列的抗菌活性预测方法及系统
申请号:CN202411917560
申请日期:2024-12-24
公开号:CN120072028A
公开日期:2025-05-30
类型:发明专利
摘要
本申请涉及一种基于LSTM模型的抗菌肽序列的抗菌活性预测方法及系统,方法包括:构建训练样本训练集,样本训练集包括正样本集和负样本集,正样本集包括经过预处理的目标菌属的抗菌肽序列,负样本集包括经过预处理的非抗菌肽序列;利用预训练的蛋白质语言模型提取样本训练集的第一高维嵌入特征;以样本训练集的抗菌活性作为标签,利用第一高维嵌入特征对初始的LSTM模型进行训练,得到训练好的LSTM模型;利用蛋白质语言模型提取待预测的抗菌肽序列的第二高维嵌入特征,将第二高维嵌入特征输入至训练好的LSTM模型,输出待预测的抗菌肽序列的抗菌活性。本申请显著提升抗菌活性预测的准确性。
技术关键词
嵌入特征
抗菌肽
抗菌活性预测
样本
LSTM模型
训练集
标签
模型训练模块
特征提取模块
数据处理模块
序列特征
计算误差
传播算法
处理器
计算机设备
优化器
可读存储介质
存储器