一种基于多元特征的液-液相分离蛋白质预测方法及系统
申请号:CN202510292965
申请日期:2025-03-13
公开号:CN119811507B
公开日期:2025-06-17
类型:发明专利
摘要
本发明公开了一种基于多元特征的液‑液相分离蛋白质预测方法,该方法在进行预测时同时提取了序列特征、二级结构特征和空间结构特征,并根据空间结构构建了残基接触图,采用图注意力网络来提取根据残基接触图和序列嵌入构建的空间结构图进行深层次结构特征的挖掘,基于蛋白质相分离行为与其结构密切相关的特性有效提高预测性能;此外,本方案采用三层堆叠的图注意力网络来提取蛋白质的结构特征,并结合序列中提取的物理化学特征,通过堆叠式的集成学习模型对液‑液相分离蛋白进行预测,可进一步提升模型预测性能。
技术关键词
蛋白质预测方法
空间结构特征
序列特征
液相
特征提取模块
节点特征
数据
物理化学特征
拼接模块
集成学习器
集成学习模型
线性变换矩阵
多头注意力机制
样本
过采样技术
软件包