一种基于深度学习的人类内源性逆转录病毒识别方法及系统
申请号:CN202510411991
申请日期:2025-04-02
公开号:CN120526851A
公开日期:2025-08-22
类型:发明专利
摘要
本发明属于生物信学与人工智能领域,公开了一种基于深度学习的人类内源性逆转录病毒识别方法及系统,该方法包括:构建人类内源性逆转录病毒识别数据集,对采集的数据进行预处理构建训练数据集和独立测试数据集;将训练数据集和独立测试数据集中DNA序列数据进行one‑hot和k‑mer两种不同特征编码生成特征向量;基于卷积神经网络构建预测模型,使用训练数据集中特征向量对预测模型进行训练,通过5折交叉验证方式优化参数模型,通过独立测试数据集评估预测模型的性能;将该模型与已有模型性能进行比较,评估本模型的优越性。本发明突破传统模型依赖单一特征的局限性,增强特征表达能力,进一步优化了分类效果。
技术关键词
内源性逆转录病毒
分类效能
评估预测模型
识别正确率
识别方法
生成特征向量
DNA序列
工作特征
识别系统
人类
构建预测模型
数据
错误率
sigmoid函数
编码
模块
曲线
核苷酸
网络结构