摘要
本发明公开了一种云计算环境中负载均衡方法及系统,涉及云计算技术领域,方法包括:接收目标用户的服务请求,获取目标用户的用户画像信息,根据用户画像信息确定与服务请求对应的目标模型,获取当前服务池中各节点的模型部署信息及当前负载值,根据用户画像信息、模型部署信息及对应的当前负载值计算服务请求与各节点的匹配度评分,根据匹配度评分确定目标节点,若目标节点的匹配度评分高于预设评分阈值,则将服务请求调度至目标节点,否则,在当前服务池部署目标模型,并将服务请求调度至当前服务池中的兼容节点;其有益效果为:可以提高服务请求调度精准性、优化资源利用率以及增强模型不可用场景下的服务连续性。