摘要
本发明公开一种蛋白质翻译后修饰与疾病关联预测系统及方法,涉及生物信息学和医疗诊断领域,所述系统包括:数据清洗模块,用于获取与蛋白质翻译后修饰相关的序列数据和对应的疾病标签数据,并对序列数据进行清洗;特征提取模块,用于学习序列数据的特征嵌入,提取包含特征信息的特征向量;关联预测模块,用于通过多头注意力机制转换特征向量,并通过Transformer结构进行疾病的关联预测;函数定义模块,用于根据生物信息的特征复杂性和目的定义损失函数;模型评估模块,用于将序列数据输入到训练好的网络模型中,并输出评估结果。根据本申请的技术方案,可以实现蛋白质翻译后修饰与疾病发展的关联性预测,具有较高的应用价值。