一种云计算环境中负载均衡方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种云计算环境中负载均衡方法及系统
申请号:CN202511060123
申请日期:2025-07-30
公开号:CN120892201A
公开日期:2025-11-04
类型:发明专利
摘要
本发明公开了一种云计算环境中负载均衡方法及系统,涉及云计算技术领域,方法包括:接收目标用户的服务请求,获取目标用户的用户画像信息,根据用户画像信息确定与服务请求对应的目标模型,获取当前服务池中各节点的模型部署信息及当前负载值,根据用户画像信息、模型部署信息及对应的当前负载值计算服务请求与各节点的匹配度评分,根据匹配度评分确定目标节点,若目标节点的匹配度评分高于预设评分阈值,则将服务请求调度至目标节点,否则,在当前服务池部署目标模型,并将服务请求调度至当前服务池中的兼容节点;其有益效果为:可以提高服务请求调度精准性、优化资源利用率以及增强模型不可用场景下的服务连续性。
技术关键词
云计算环境 均衡方法 节点 计算机可执行指令 语义向量 优化资源利用率 画像特征 错误率 计算机存储介质 均衡系统 云计算技术 时延 处理器 模块 多标签 因子 存储器