摘要
一种基于多特征融合的基因预测及功能肽识别方法,它涉及一种基因预测及功能肽识别方法。本发明为了解决传统预测方法无法自动提取特征导致效率低下且成本高;多数模型依赖局部序列特征,无法充分捕捉序列的潜在生物活性信号导致信息考虑不足的问题。本发明包括基因预测部分的特征提取模块、多特征融合模块、卷积神经网络模块、Transformer编码器模块、分类预测模块、蛋白质翻译与保存模块;功能肽识别部分的肽序列表示模块、Bert模块、CNN模块、Bi‑LSTM模块、特征融合与分类模块;数据集构建;模型评估。本发明属于生物信息学技术领域。