摘要
本发明公开了一种基于混合机器学习模型的氯离子扩散系数预测方法,广泛收集实际数据并进行预处理,利用LASSO回归特征选择方法对影响氯离子扩散系数的参数进行选择,防止回归模型在训练集上的过拟合问题;在训练集上利用基于决策树算法的分布式梯度提升算法(LightGBM)对氯离子扩散系数的若干参数进行回归分析,将得到预测值与原有参数进行升维处理后的数据作为高斯过程回归(GPR)的输入,真实值作为输出,训练GPR模型,分析GPR预测结果,并使用贝叶斯参数优化方法构建LightGBM‑GPR模型。本发明方法既保留了LightGBM预测误差小的特点又给出了不确定性概率区间,提高了对氯离子扩散系数的预测能力。