一种云平台故障检测及运维系统、方法、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种云平台故障检测及运维系统、方法、设备及存储介质
申请号:CN202410713828
申请日期:2024-06-04
公开号:CN118550752A
公开日期:2024-08-27
类型:发明专利
摘要
本申请公开了一种云平台故障检测及运维系统、方法、设备及存储介质,涉及云计算领域,包括:告警信息推送模块,用于配置告警推送,以便将告警信息推送至计算节点评估模块;计算节点评估模块,用于对告警信息进行筛选,确定目标告警,基于目标告警及预设评估项对计算节点进行评估,获取评估结果;故障恢复模块,用于基于评估结果确定对虚拟机执行的故障恢复操作,监测云平台集群的剩余资源,若剩余资源大于或等于目标阈值,则基于故障恢复操作向云平台集群发送故障恢复指令,监控云平台集群基于故障恢复指令的动作执行结果,以便基于动作执行结果进行相应的操作,完成对云平台的故障检测及运维。本申请实现了无人值守准确高效的故障恢复。
技术关键词
云平台集群 网络连通性检测 逻辑卷管理 故障检测 云平台故障 节点 故障恢复模块 策略 光纤 智能平台管理接口 虚拟机系统盘 告警系统 分布式文件系统 监控云平台 通道 宕机 日志