摘要
本发明公开了大语言模型智能体个性化响应生成方法及装置,涉及个性化推荐技术领域。包括:从历史交互行为中获取偏好集合,基于思维链为每个偏好构建一组偏好链;基于生成函数对当前时刻的交互行为进行改写,得到多个语义等价版本以及增强交互集合;基于评分函数确定每一组偏好链和增强交互集合的细粒度对齐得分以及每个偏好的相对强度;将当前时刻的交互行为和初始状态为空的响应前缀作为基础输入,针对每组偏好链构建提示模板;根据相对偏好强度对下一令牌概率分布进行加权求和,得到个性化目标分布,根据个性化目标分布逐词采样生成下一个令牌,将令牌拼接到响应前缀中并更新所述响应前缀,直到响应结束输出完整的个性化响应。