摘要
本发明公开了一种基于AI算法的运维故障自愈系统及方法。系统包括数据采集模块、数据预处理模块、异常检测模块、根因分析模块、自愈策略生成模块、自动化执行模块。方法包括以下步骤:S1.采集用户系统数据并对采集到的数据进行预处理;S2.对预处理后的数据信息进行异常检测,并对检测到的异常数据进行根因分析;S3.基于故障根因以及用户系统数据生成最优自愈策略后执行。本发明利用AI算法自动的对监控数据进行分析和自动对故障应用进行重启,大大提高运维效率,对故障定位效率大幅度提高,故障恢复时间大幅度降低,系统可用度大幅度提高。