摘要
本申请涉及动车组状态预测领域,提供了基于随机森林算法的动车组车轮多边形预测方法及系统,包括从运维历史数据中,选取相关系数满足要求的特征指标作为训练样本,并分成训练集和测试集;抽取训练集的特征信息生成多个随机样本集;生成多个随机样本集的CART回归树,取多棵CART回归树的输出均值作为预测结果,得到动车组车轮多边形的初始预测模型;将测试集输入初始预测模型,对测试集的特征信息进行随机采样并反复构建模型,选出准确率最高的特征放到最优特征子集,剩余的特征重复随机采样,直到遍历所有特征后停止,得到最终预测模型。利用随机森林算法以及多棵决策树的协同工作,提升对车轮多边形状态预测的准确性和可靠性。