摘要
本发明涉及智能运维技术领域,尤其涉及一种基于实时监控的流式计算任务智能运维方法,该方法包括:获取监测节点数据;确定高负载节点;确定关注节点;确定异常节点;确定故障风险节点;调整标准一致度或偏差指数;发出运维警报。本发明通过将不同性能指标之间的内在关系转化为逐层递进的判定逻辑,强化了异常识别的精度与灵敏度:前期以订单接收速率与成功率识别可能存在流量压力的节点,结合数据处理速率和状态堆积度进一步区分,随后通过资源使用率与检查点完成时间交叉验证节点负载是否已影响系统稳定运行,有效解决了由于资源调度过于独立和运维任务同步度低导致系统负载过高和响应时间延迟的问题。