摘要
本发明涉及一种基于深度强化学习的个性化奖励分配方法及系统,包括响应于用户通过客户端发起参与奖励分配活动的请求,通过分布式数据采集框架采集用户的特征数据和奖励池信息,并进行标准化处理以生成结构化输入数据;利用深度强化学习模型处理结构化输入数据,生成个性化奖励分配概率,并通过约束优化算法确保分配成本满足预设预算约束;根据个性化奖励分配概率,采用随机化算法执行用户请求的奖励分配并返回分配结果。本发明通过深度强化学习实现个性化奖励分配,显著提升用户参与度和满意度;分布式数据处理和在线学习机制确保实时性和动态适应性;约束优化算法有效控制分配成本,适合大规模应用。