摘要
本申请提供一种模型训练方法、风险行为识别方法、系统、设备及介质,所述训练方法包括:获取训练数据集;所述训练数据集包括图像数据和文本数据;基于所述训练数据集利用多阶段蒸馏训练策略对风险行为识别模型进行训练,获取训练后的风险行为识别模型;所述多阶段蒸馏训练策略包括对所述风险行为识别模型的语义表示、注意力分布和/或风险标签阶段进行蒸馏训练。本申请利用多阶段蒸馏训练策略对风险行为识别模型进行训练,使得小模型在多任务表现接近大型模型水平的同时,显著减少了内存和算力消耗,解决了现有技术中用于识别风险行为的传统视角语言模型参数量大、难以边缘部署的问题。