一种基于多模态自适应融合的情感识别方法、系统、设备及存储介质

申请号：CN202510542178

申请日期：2025-04-28

公开号：CN120449096A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了一种基于多模态自适应融合的情感识别方法、系统、设备及存储介质，涉及人工智能技术领域，方法包括：选取预训练模型分别提取音频和视频的原始特征，音频用卷积层初步提取，视频经多模块处理并保留时序信息。接着构建注意力模块生成注意力矩阵和交互特征，用该矩阵调整原始特征。再将加权融合后的特征输入卷积网络提取高级时序特征，之后对其在时间维度池化压缩，将音频和视频特征拼接，最后送入全连接层分类器得出情感分类结果；本发明能够动态调整不同特征的权重，从而有效融合音频和视觉特征，以提升情感识别的准确性和鲁棒性，在加权召回率和未加权召回率方面均表现出显著提升，且具有较高的计算效率和可扩展性。

技术关键词

情感识别方法时序特征交互特征多模态计算机可执行指令视觉特征时间序列特征矩阵视频时序信息特征提取模块情感识别系统视频特征提取音频特征提取多头注意力机制

系统为您推荐了相关专利信息

待查询数据的查询方法、电子设备以及存储介质

实体查询方法计算机程序指令多模态特征电子设备

一种基于记忆混合原型与知识蒸馏的海洋生物群落监测方法及系统

群落监测方法原型蒸馏跨模态多源异构监测数据

一种多模态融合的肛肠数据可视化分析方法及系统

数据可视化分析方法特征金字塔网络可变形卷积网络生理数据可视化分析系统

一种基于数字孪生的高压配电房机器人状态监测系统及方法

高压配电房数字孪生状态监测系统状态监测模块数据采集层

一种土壤重金属污染来源判别方法、装置、设备及介质

来源判别方法土壤重金属污染因子像素点样本