摘要
本发明公开了一种基于机器学习的多源数据识别强对流云团方法,包括收集历史强对流天气中国家地面气象观测站点的天气数据,以及静止卫星数据和雷达数据,通过时空匹配形成静止卫星通道数据与站点匹配的具有强对流标记的原始数据样本,并预处理形成原始强对流云团数据集;使用随机森林算法从原始强对流云团数据集中提取特征,并与原特征进行结合形成带有新特征的强对流云团数据集,然后输入逻辑回归模型中,训练获得强对流云团识别模型;获取地球静止卫星数据并使用强对流云团识别模型进行强对流云团识别。本发明使用多源数据形成强对流云团数据集,提高了数据样本的准确率,并利用了RF算法+LR模型实现了全天候全覆盖识别强对流云团的效果,克服了传统方法的局限性。