一种面向服务型机器人的多模态情感识别方法及系统

申请号：CN202511520732

申请日期：2025-10-23

公开号：CN120995416A

公开日期：2025-11-21

类型：发明专利

摘要

本发明属于人工智能技术领域，尤其是指一种面向服务型机器人的多模态情感识别方法及系统，所述方法包括：采集用户情绪变化的音视频流数据，分离出视觉与语音数据；通过预训练模型提取视觉、语音情感特征，计算各模态预测概率分布；基于该分布构建双模态置信度量化模型，得到各模态置信度；采用分段式动态权重分配策略融合特征，进而识别用户情感状态。本发明融合视觉与语音模态，结合动态时间规整实现特征对齐，通过置信度模型、动态权重策略及跨模态时序协同模块、共享表示空间优化性能，在复杂环境下具备高识别准确率、强鲁棒性及实时处理能力，适用于多种服务场景。

技术关键词

情感特征情感识别方法服务型机器人动态权重分配语音分类模型动态时间规整技术双模态图像分类模型融合特征计算机软件产品模态特征数据音频特征跨模态视觉特征计算机存储介质置信度阈值情感状态识别