摘要
本发明公开一种基于大模型的云服务器健康管理方法及系统,涉及服务器健康管理技术领域,方法包括:采集云服务器的性能状态数据、云服务器的维修记录和历史报告信息;对性能状态数据进行预处理,并随机划分到训练集和测试集;构建基于误差补偿的GRU模型,使用训练集训练GRU模型,使用测试集评估GRU模型;利用GRU模型的输出来建立性能预警模型,来判断云服务器的运行状态,并在检测到云服务器异常时发出告警;将维修记录和历史报告信息进行格式转换,用于对大模型进行微调;将告警时的性能状态数据输入微调后的大模型,以输出异常状态预测结果、异常产生的原因和维修的相关建议。本发明可以实现对云服务器状态的精准预警,提高运维人员的处理效率。