基于大模型技术实现分布式系统故障传播路径分析与阻断的系统及方法
申请号:CN202510564807
申请日期:2025-04-30
公开号:CN120416002A
公开日期:2025-08-01
类型:发明专利
摘要
本发明提出了一种基于大模型技术实现分布式系统故障传播路径分析与阻断的系统及方法,包括:对分布式系统进行监控,识别出分布式系统出现的故障并发出告警;在收到告警后,通过分布式系统的服务运行数据来度量单个服务故障事件以及分析不同服务故障事件之间的因果关系,得到服务故障内容;对分布式系统中的节点和边进行标注,构建服务故障传播图;根据构建的服务故障传播图和输出的服务故障内容,识别出按照传播概率排序的故障路径;收到故障传播路径识别模块所识别的故障路径后,采取预设的故障阻断策略对故障进行阻断。本发明提高故障诊断的效率和准确性,有效阻止故障的进一步传播,降低系统损失,能够持续优化系统的故障处理能力。
技术关键词
分布式系统
故障传播路径
监控模块
识别模块
度量
子模块
节点
效应
服务器设备
限流功能
策略
系统日志
协方差矩阵
识别算法
强度
自然语言
数据格式