基于深度强化学习的个性化奖励分配方法及系统

申请号：CN202511126369

申请日期：2025-08-12

公开号：CN120634636B

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及一种基于深度强化学习的个性化奖励分配方法及系统，包括响应于用户通过客户端发起参与奖励分配活动的请求，通过分布式数据采集框架采集用户的特征数据和奖励池信息，并进行标准化处理以生成结构化输入数据；利用深度强化学习模型处理结构化输入数据，生成个性化奖励分配概率，并通过约束优化算法确保分配成本满足预设预算约束；根据个性化奖励分配概率，采用随机化算法执行用户请求的奖励分配并返回分配结果。本发明通过深度强化学习实现个性化奖励分配，显著提升用户参与度和满意度；分布式数据处理和在线学习机制确保实时性和动态适应性；约束优化算法有效控制分配成本，适合大规模应用。

技术关键词

奖励分配方法深度强化学习模型分布式数据采集约束优化算法在线学习算法分布式数据处理深度神经网络项目流式数据处理技术处理器上执行程序数据采集模块在线学习机制客户端统计学特征归一化算法分布式数据库框架