摘要
本申请公开了无服务计算中冷启动策略优化方法、装置、设备及介质,涉及云计算技术领域,包括:根据状态空间和动作空间确定目标冷启动策略模型的奖励函数;对未来时间段内的函数调用次数进行预测,以获取预测结果;确定目标深度强化学习算法的动作选择,基于动作选择及奖励函数确定目标值;基于Q值损失函数、Huber损失函数及目标损失函数确定综合损失函数;利用动作变化差值对策略网络进行更新,获取更新后网络,通过综合损失函数对价值网络进行优化,获取优化后网络,通过更新后网络及优化后网络确定目标冷启动策略模型,利用目标冷启动策略模型对无服务计算的冷启动策略进行优化。由此,本申请提升了系统的响应速度和资源利用效率。