摘要
本发明提出一种基于行为序列数据的用户群体分类和潜客识别方法,属于时空数据挖掘领域,包括:S1:获取并预处理多类用户行为数据,以用户为基本单元对行为数据进行统一编码,转换为用户行为序列;S2:基于序列建模技术构建预训练模型,设计自监督预训练任务,利用用户行为序列对预训练模型进行训练,生成通用用户表征;S3:对于一般下游任务,通过深度神经网络完成通用用户表征到任务标签的映射,冻结预训练模型参数,仅微调下游任务的解码器参数即可;对于样本稀少的下游任务,冻结预训练模型的参数,直接使用通用用户表征完成目标任务。本发明方法利用自监督学习与模型微调有效地学习了用户的通用行为模式,提升了模型的迁移与适应能力。