一种基于组合特征编码和DNA结合位点的预测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于组合特征编码和DNA结合位点的预测方法
申请号:CN202411844225
申请日期:2024-12-16
公开号:CN119314553A
公开日期:2025-01-14
类型:发明专利
摘要
本发明公开了一种基于组合特征编码和DNA结合位点的预测方法,该方法属于位点预测领域。该方法包含如下步骤:对初始数据集剔除低方差特征并设置重组率阈值标记样本;根据输入标签判断任务类型使用分类或回归算法;使用Optuna优化参数并分配给对应参数;随机地分配训练和测试数据集;分别输入数据集到多种算法包括随机森林和深度森林等中进行训练;根据评价指标,选择表现最佳的模型作为最终预测模型;最终,通过最优模型对测试集进行预测。该方法实现了出色的高精度和低误差,同时具有更好的移植性,为药物设计中高效重组系统的研究提供了新的思路。
技术关键词
随机森林 位点 序列变体 样本 特征编码方法 组合特征向量 数据 标记 矩阵 滑动窗口 方差特征 重组系统 DNA序列 回归算法 扫描方法 节点 参数