基于进化信息与Transformer神经网络算法的MHCll结合肽的设计方法
申请号:CN202511211222
申请日期:2025-08-28
公开号:CN120727089B
公开日期:2025-11-21
类型:发明专利
摘要
一种基于进化信息与Transformer神经网络算法的MHCll结合肽的设计方法,涉及蛋白质设计领域,其包括以下步骤:S1、对每种MHCII分子的等位基因及其对应结合肽的binding core序列提取其进化信息特征,S2、建立基于卷积模块与Transformer模块融合的神经网络模型,将S11和S12中提取的两种频率特征张量作为双输入,最终得到的是每条序列的各个位置的20种氨基酸的概率分布,S3、根据神经网络模型的输出结果,按照概率进行随机采样,生成满足目标分布的MHCII‑peptide的binding core序列。引入序列位置氨基酸频率(一阶保守性分析)与氨基酸对的联合频率(二阶保守性分析)等进化信息设计新的短肽序列这一方法解决了短肽无法基于结构设计的难题,提供了基于进化信息设计短肽序列的可靠性。
技术关键词
神经网络算法
频率
序列
神经网络模型
卷积特征
注意力机制
矩阵
特征提取模块
Softmax函数
卷积模块
核心
复合体
深度学习模型
分子
数据获取模块
设计系统
堆叠结构
处理器