一种基于视频流与语音的实时情绪识别系统及方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于视频流与语音的实时情绪识别系统及方法
申请号:CN202510016775
申请日期:2025-01-06
公开号:CN119810892A
公开日期:2025-04-11
类型:发明专利
摘要
本发明公开了一种基于视频流与语音的实时情绪识别系统及方法,该系统包括:数据采集模块:用于通过摄像头实时采集用户面部表情的视频帧,同时通过麦克风实时采集用户的语音信号;特征提取模块:用于将视频帧输入卷积神经网络以提取视觉特征,同时将语音信号输入长短期记忆网络以提取时序特征;加权融合模块:用于将视觉特征和时序特征进行加权融合,生成多模态特征向量;情绪识别模块:用于调用外部大模型的API,对视频帧中的情绪进行进一步识别,获取外部大模型反馈的情绪识别结果,并将外部大模型反馈的情绪识别结果与多模态特征向量进行进一步结合,以生成并输出最终的情绪识别结果。本发明能够提高情绪识别的准确性、高效性与实时性。
技术关键词
情绪识别系统 特征提取模块 视觉特征 时序特征 长短期记忆网络 视频流 语音 增量学习算法 视频帧 多模态 数据采集模块 情绪识别方法 情绪识别模型 麦克风 特征提取模型 识别模块 面部 信号 语谱图
系统为您推荐了相关专利信息
慢性阻塞性肺病 风险预测模型 风险评估系统 特征提取模块 多层次特征融合
应力监测方法 数字孪生驱动 压力容器 LSTM模型 KNN算法
轧制力预测方法 轧制工艺参数 神经网络模型 级联 指标
样本 数据 模型训练方法 负荷特征 电负荷预测方法
人工智能模型 视频帧 图像 视频编辑方法 视觉特征信息