摘要
本公开涉及情绪检测方法及装置。所述方法包括:对输入视频逐帧进行标准化处理,以获得多个单帧人脸图像;对单帧人脸图像进行处理,以提取单帧人脸图像的帧级特征;识别输出视频中情绪转变的时间点,并且基于时间点对输出视频进行分段以获得多个视频子片段;针对每个视频子片段,通过时序动态适配器将相应视频子片段内的单帧人脸图像的帧级特征聚合以生成聚合视频特征;将相应视频子片段的聚合视频特征输入大语言模型以生成描述情绪状态的文本;利用文本分类回归模型对文本进行分析,以输出每个视频子片段的情绪类别及对应的情绪强度值。由此,能够精确捕捉并分析视频中面部情绪的动态变化过程,且保证了计算效率并提升了结果的可解释性。