基于大模型的服务自动伸缩方法、装置、设备及存储介质
申请号:CN202510975368
申请日期:2025-07-15
公开号:CN121012862A
公开日期:2025-11-25
类型:发明专利
摘要
本发明实施例涉及信息处理技术领域,公开了一种基于大模型的服务自动伸缩方法、装置、设备及存储介质,方法为获取待伸缩资源服务的多源异构历史数据;利用多模态资源预测模型对多源异构历史数据进行预测,得到资源预测值;利用因果推理结合多源异构历史数据纠正资源预测值,得到资源预测纠正值;获取待伸缩资源服务的服务画像及待伸缩资源服务的全局资源视图;基于全局资源视图、资源预测纠正值及服务画像确定出对待伸缩资源服务的资源伸缩策略。结合不同数据维度进行预测,提高了预测精度,且在提高预测精度的基础上,利用多模态资源预测模型的轻量化部署和流式处理,实现在较低部署资源成本基础上快速预测,成功化解预测精度和响应速度的矛盾。
技术关键词
伸缩方法
资源
异构
画像
多模态
预分配方法
配额
服务器
信息处理技术
策略
生成容器
处理器通信
伸缩装置
集群
可读存储介质
精度
存储器
模板
动态