摘要
本发明涉及大数据技术领域,具体公开了一种基于大数据分析的停电恢复时间预测方法,方法包括数据采集与预处理、特征集构建、模型构建、模型评估和决策支持。本方案从时间依赖性、空间依赖性和电力设施状况三个维度分析目标区域的停电时间恢复影响因素,保证了特征构建的全面性和数据的多样性,通过mRMR方法进行特征筛选,有效选出与目标变量强相关但冗余性低的子特征,生成简洁高效的特征集,有效降低复杂性和计算成本;构建XGBoost‑GAFT预测模型,有效处理复杂的停电恢复时间预测和分布拟合问题,通过学习特征集和目标变量间的残差,对于数据不均衡和不确定性大的情境,提供了较高的模型泛化能力和准确性。