摘要
本发明公开了一种基于组合特征编码和DNA结合位点的预测方法,该方法属于位点预测领域。该方法包含如下步骤:对初始数据集剔除低方差特征并设置重组率阈值标记样本;根据输入标签判断任务类型使用分类或回归算法;使用Optuna优化参数并分配给对应参数;随机地分配训练和测试数据集;分别输入数据集到多种算法包括随机森林和深度森林等中进行训练;根据评价指标,选择表现最佳的模型作为最终预测模型;最终,通过最优模型对测试集进行预测。该方法实现了出色的高精度和低误差,同时具有更好的移植性,为药物设计中高效重组系统的研究提供了新的思路。