摘要
本申请公开了一种存储设备的故障处理方法、控制器、设备、介质及产品,涉及存储系统技术领域,包括通过第一控制器的第一基板管理控制器检测第二控制器是否发送告警信号,该告警信号对应第二控制器的第二处理器宕机,实现故障的精准识别;在接收到该告警信号后,第一控制器停止通过非透明桥链路与第二控制器通信,避免了故障从单控制器扩散至整机;第一控制器的第一基板管理控制器同时检测自身的第一处理器是否宕机,实现自我故障检测,当检测到第一处理器宕机时,由第一基板管理控制器重置第一控制器本身,而非整机复位,这种只针对故障控制器进行修复的方式,不会影响其他业务的正常运行,减少了业务中断范围,实现了故障的精准隔离与控制。