摘要
本发明涉及一种基于BMC的服务器故障智能检测方法,通过将待检测服务器调整至BMC的debug模式获取原始数据,并判断BMC接收到的数据是否为传感器故障数据,当BMC接收到传感器异常的告警;构建故障模型并进行训练和优化;实时采集待检测服务器的指定数据,预处理后输入优化后的故障模型,所述故障模型对预处理后的指定数据进行自动分类,判断待检测服务器是否存在故障或故障倾向,若是,启动自动化修复策略,通过自动化决策为根据故障的严重程度和影响范围决定采取何种修复措施,通过自动化操作的自动化脚本或工具,执行修复操作。通过深度挖掘 BMC 底层数据价值、融合智能模型与自动化修复机制,实现了服务器故障检测与处理的全流程优化。