缓存决策模型训练方法、装置、设备、介质及程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
缓存决策模型训练方法、装置、设备、介质及程序产品
申请号:CN202411866440
申请日期:2024-12-18
公开号:CN119740677A
公开日期:2025-04-01
类型:发明专利
摘要
本申请提供一种缓存决策模型训练方法、装置、设备、介质及程序产品,涉及量子技术领域,包括:根据缓存决策模型状态空间、动作空间、奖励函数,通过量子搜索算法,以强化学习算法贝尔曼方程迭代计算每个历史请求状态下,每个缓存动作对应的累积奖励值,直到缓存决策模型收敛,其中在当前迭代回合中执行第一历史请求状态下的一个目标缓存动作的情况下:若当前迭代回合目标缓存动作对应的累积奖励值大于或等于上一迭代回合第一历史请求状态下所有的缓存动作对应的最大累积奖励值,则通过量子操作提高选择目标缓存动作的概率。本申请的方法利用量子搜索算法,提高后续选择好动作的概率以加快强化学习算法的收敛速度,降低缓存决策模型的训练时间。
技术关键词
决策模型训练方法 缓存决策方法 强化学习算法 时延 基站 数据 计算机执行指令 搜索算法 周期 量子纠缠态 方程 模型训练装置 可读存储介质 计算机程序产品 处理器通信 存储器 电子设备
系统为您推荐了相关专利信息
多智能体深度强化学习 卫星网络环境 强化学习算法 多智能体强化学习 决策
人工智能驱动 水泥复合材料 生命周期分析 计算机系统上执行 实时数据
精度控制方法 编程 PID算法 偏差 模具
无人配送系统 存储柜 折叠框 供能装置 基站
微波 图像生成方法 前馈控制器 拉普拉斯 时延