摘要
一种基于机器学习的苦味化合物预测方法,它属于化合物预测技术领域。本发明解决了传统方法存在的耗时长、准确率低的问题。本发明得到化合物的15种分子指纹组合,按照互信息值由大到小的顺序对每种分子指纹组合的特征进行排序。利用特征增量选择方法将每种化合物样本排序后的分子指纹组合特征输入苦味化合物预测模型内,计算每种分子指纹组合的预测准确率,根据每种分子指纹组合特征及其预测的准确率生成对应分子指纹组合的特征增量选择曲线图,选取准确率最高的特征之前的所有特征,进而得到最佳的分子指纹组合以及最佳的特征个数,将待预测化合物在最佳分子指纹组合下的特征向量作为模型输入,得到预测结果。本发明方法可以应用于化合物预测。