摘要
本发明公开了一种基于生物分词的抗病毒肽预测方法,属于抗病毒肽药物预测技术领域,包括以下步骤:S1:构建数据集;S2:生物分词处理;S3:生物分词特征表示;S4:构建生物分词预测模型;S5:模型训练;S6:利用模型进行预测。本发明使用生物分词将肽序列表示为自然语言处理中的句子,然后使用Word2Vec来获取这些生物分词的嵌入表示,基于生物分词的嵌入表示,构建了生物分词预测模型,实现了对抗病毒肽更高的预测精度,并通过将本发明生物分词预测模型与其他最先进的模型进行比较,证明了所提出的生物分词方法的有效性。