摘要
本申请公开了一种基于强化学习的广告效果评估方法及系统,涉及机器学习技术领域,其中方法包括:获取多源数据,包括毫米波雷达数据、WiFi探针数据和匿名二维码数据;构建状态空间;将多源数据代入状态空间得到状态向量;由智能体在状态向量下输出最优动作;基于权重和每种数据的单维度效果评分计算综合效果评分;根据综合效果评分确定即时奖励;根据当前时刻的状态向量、最优动作、即时奖励以及下一时刻的状态向量更新网络参数,优化强化学习模型;将待处理多源数据输入强化学习模型得到广告效果评估结果。本申请采用毫米波雷达+WiFi探针+匿名二维码相结合的方式,不存在隐私风险,而且能够得到较为准确的广告效果评估结果。