摘要
本发明公开了一种基于强化学习驱动大模型自适应提示的推荐方法及系统,本发明方法包括获取用户画像文本并进行语义相似度匹配以确定用户对应的提示词类型;通过深度Q网络DQN、置信上限算法UCB在预设的多种提示优化策略选择推荐的提示优化策略并获得提示优化策略S;基于提示优化策略S和用户对应的提示词类型利用大模型生成优化后的提示词,利用推荐系统进行验证和性能指标评估;继续迭代直至满足预设的结束条件以得到优化后的提示词以应用于目标推荐系统。本发明旨在通过引入细粒度用户画像和强化学习驱动大模型为不同用户群体进行个性化提示优化的机制,解决现有推荐技术中软提示模板僵化、个性化不足的问题,提升推荐准确性。