一种基于SMILES序列及其图信息融合学习的β分泌酶抑制剂分子活性预测方法
申请号:CN202510140149
申请日期:2025-02-08
公开号:CN120072040A
公开日期:2025-05-30
类型:发明专利
摘要
本发明涉及一种基于SMILES序列及其图信息融合学习的β分泌酶抑制剂分子活性预测方法及系统,属于抑制剂分子活性预测领域。所述方法,首先,设计一个带增强分层注意机制的BiLSTM‑Transformer框架,对β分泌酶抑制剂分子SMILES字符串派生的功能子序列进行编码。功能子序列从SMILES字符串中提取,分为官能团、离子和原子水平上的多个层次,可增强对分子结构细节的理解。其次,基于从SMILES字符串生成的分子图结构,设计了一种具有原子级特征注意机制的图编码模型,不仅突出了分子图结构中的关键原子和化学键,还进一步增强了分子图的特征表示能力。最后,通过全局注意力机制和加权模块,将不同模态的分子信息进行融合学习,获得β分泌酶抑制剂分子活性预测结果。
技术关键词
酶抑制剂
活性预测方法
分子
序列
注意力机制
分层注意力
编码
BiLSTM模型
多层感知机
官能团
节点
消息传递机制
字符
多层次特征
模块
框架