摘要
本发明提供一种广告的代码位排序方法、装置、介质及设备,所述方法包括:收集用户在产品内的行为数据和用户的基本信息,根据行为数据和基本信息构建动态用户画像,根据动态用户画像构建深度强化学习模型,使用历史行为数据和广告数据对深度强化学习模型进行训练,获得训练好的深度强化学习模型,将待评估的动态用户画像和广告数据输入所述训练好的深度强化学习模型,输出广告代码位排序策略。本发明能够充分考虑用户个性化特征和动态广告场景,实现广告候选代码位智能、实时排序的方法,以提高广告变现效率,增强企业在IAA行业的市场竞争力。