摘要
本发明公开了一种算力网络中负载感知的多微服务副本弹性伸缩方法,旨在应对动态的在线工作负载环境,保证端到端响应时延满足服务水平协议(SLA)的同时提高微服务资源利用率。该发明首先通过Prometheus、cAdvisor和Istio等插件采集Kubernetes集群中各微服务的历史性能数据,并将这些数据存储于时间序列数据库中,构建训练数据集。随后,根据微服务之间的调用关系和数据集中的微服务特征构建图数据结构,利用图注意力网络训练多微服务CPU利用率和P90响应延迟预测器,从而形成智能体可交互的模拟环境。基于此模拟环境,设计并训练深度上下文多臂赌博机模型,结合上置信界(UCB)策略,在大状态空间和复杂非线性关系中选择最优的副本调整策略,实现多微服务系统的自动水平伸缩。最终,将训练好的模型部署于实际环境中,通过Prometheus定期监测和更新微服务的上下文信息,进行实时副本调整,降低SLA违规风险并提升资源利用率。