一种基于ESM-2和双路径神经网络的DNA结合蛋白和RNA结合蛋白分类方法
申请号:CN202411719296
申请日期:2024-11-28
公开号:CN119229982B
公开日期:2025-02-25
类型:发明专利
摘要
本发明提供了一种基于ESM‑2和双路径神经网络的DNA结合蛋白和RNA结合蛋白分类方法,具体表现为将ESM‑2与双路径神经网络相结合的分阶段分类方法,称为DRBP‑EDP;在第一阶段训练中,将蛋白质序列分类为核酸结合蛋白或非核酸结合蛋白;在第二阶段训练中,进一步将核酸结合蛋白分类为DNA结合蛋白或RNA结合蛋白;同时,本发明还构建了精细的数据集构建方法,从而创建了高质量的蛋白质分类数据集,通过这种方法,DRBP‑EDP模型取得了很好的性能,第一阶段对核酸结合蛋白和非核酸结合蛋白的分类准确率为90.03%,第二阶段对DNA结合蛋白和RNA结合蛋白的分类准确率为89.56%,不仅为蛋白质分类提出了新的见解和方法,还为研究蛋白质功能提供了创新工具,从而为生命科学的发展提供了新的机遇。
技术关键词
分类方法
核酸
多头注意力机制
Attention机制
蛋白质序列变体
研究蛋白质功能
分类准确率
数据集构建方法
编码器
前馈神经网络
分阶段
标记
数据校正
超参数
训练集
策略
关系