一种基于Transformer模型的AI多肽结构鉴定方法及其应用
申请号:CN202410727768
申请日期:2024-06-06
公开号:CN118298927B
公开日期:2024-09-20
类型:发明专利
摘要
本发明公开了一种基于Transformer模型的AI多肽结构鉴定方法及其应用,属于质谱鉴定分析领域。包括如下步骤:步骤1:收集多肽质谱信息数据,对多肽质谱信息数据进行预处理得到关联性匹配结果,根据关联性匹配结果构建标准数据集;步骤2:建立第一模型,所述的第一模型为基于Transformer架构的AI多肽结构鉴定基础模型,包括嵌入层、编码器、解码器、输出层,将步骤1中所述的标准数据集输入第一模型进行训练,得到训练好的模型即第二模型;步骤3:将待测质谱数据输入第二模型,获得预测结果。本发明可以通过质谱数据有效预测多肽序列,具有高效、准确且不依赖于序列库,而同时可利用物种相关性进行多肽解谱。
技术关键词
多肽结构
注意力
前馈神经网络
编码器
序列
数据
信息编码
输入解码器
优化器
表达式
基础
质谱仪
离子
样本
模块