一种基于多视图图嵌入融合的蛋白质-DNA结合位点的预测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多视图图嵌入融合的蛋白质-DNA结合位点的预测方法
申请号:CN202410923888
申请日期:2024-07-11
公开号:CN118824353A
公开日期:2024-10-22
类型:发明专利
摘要
本发明公开了一种多视图图嵌入融合的蛋白质‑DNA结合位点预测方法EGPDI,利用蛋白质结构生成模型AlphaFold2获取蛋白质结构,整合蛋白质序列构成数据集;将蛋白质‑DNA结合位点问题转换为图节点分类问题;使用预训练的蛋白质语言模型(pLMs)生成嵌入和手工设计的特征共同构成图的节点特征编码;基于蛋白质的3D结构信息设计图的边特征编码;采用等变图神经网络和图卷积网络从不同的视图角度捕获信息;使用搭建的EGPDI模型对数据集进行预测,并采用Grid Search超参数优化对模型进行参数优化;采用五折交叉验证的评估方式对模型性能进行评估,使用特异性、精确率、召回率、F1‑score和马修斯相关系数,五个评估指标衡量模型;采用独立测试和案例分析进行模型泛化能力的验证,相比于最先进的方法,EGPDI有了显著的性能提升。
技术关键词
位点预测方法 节点特征 隐马尔可夫模型 多头注意力机制 融合蛋白质 序列 多层感知机 编码方案 样本 矩阵 网络 指标 高性能 数据 两点 参数 手工