一种基于视频流与语音的实时情绪识别系统及方法

申请号：CN202510016775

申请日期：2025-01-06

公开号：CN119810892A

公开日期：2025-04-11

类型：发明专利

摘要

本发明公开了一种基于视频流与语音的实时情绪识别系统及方法，该系统包括：数据采集模块：用于通过摄像头实时采集用户面部表情的视频帧，同时通过麦克风实时采集用户的语音信号；特征提取模块：用于将视频帧输入卷积神经网络以提取视觉特征，同时将语音信号输入长短期记忆网络以提取时序特征；加权融合模块：用于将视觉特征和时序特征进行加权融合，生成多模态特征向量；情绪识别模块：用于调用外部大模型的API，对视频帧中的情绪进行进一步识别，获取外部大模型反馈的情绪识别结果，并将外部大模型反馈的情绪识别结果与多模态特征向量进行进一步结合，以生成并输出最终的情绪识别结果。本发明能够提高情绪识别的准确性、高效性与实时性。

技术关键词

情绪识别系统特征提取模块视觉特征时序特征长短期记忆网络视频流语音增量学习算法视频帧多模态数据采集模块情绪识别方法情绪识别模型麦克风特征提取模型识别模块面部信号语谱图

系统为您推荐了相关专利信息

基于护理信息的慢性阻塞性肺病风险评估系统

慢性阻塞性肺病风险预测模型风险评估系统特征提取模块多层次特征融合

一种数字孪生驱动的压力容器应力监测方法

应力监测方法数字孪生驱动压力容器 LSTM模型 KNN算法

一种非末道次轧制力预测方法及系统

轧制力预测方法轧制工艺参数神经网络模型级联指标

模型训练方法、电负荷预测方法、设备及存储介质

样本数据模型训练方法负荷特征电负荷预测方法

视频编辑方法、计算机设备、存储介质和计算机程序产品

人工智能模型视频帧图像视频编辑方法视觉特征信息