摘要
本发明提供了一种面向认知气泡消解的内容推荐方法,涉及内容推荐领域,该方法包括从获取到的离线交互数据中,提取用户与推荐内容的关键特征,并从兴趣度、过曝光度和认知失调度三方面构建并训练出融合认知感知的满意度模型;采用强化学习框架,结合满意度模型提供的反事实奖励,训练推荐策略模型与去噪状态更新器;在实时交互中,使用滑动时间窗口获取用户历史行为信息,并结合去噪状态更新器得到当前用户状态表征,输入到推荐策略模型中给出推荐内容;将用户对于当前推荐内容的实时反馈记录到数据缓存区中,用于模型微调优化,确保推荐结果能够突破用户固有认知局限,促进积极思想和内容的传播。本发明解决了推荐系统与用户交互过程中存在的认知极化问题。