基于目标场景的语音情感识别方法、装置、设备及介质

申请号：CN202510918123

申请日期：2025-07-03

公开号：CN120656490A

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及语音语义技术领域，可应用于金融科技、医疗健康等业务系统平台中，揭露了基于目标场景的语音情感识别方法、装置、设备及介质，所述方法包括：获取初始语音信号，对所述初始语音信号进行信号编码，得到语音编码特征；对所述语音编码特征进行声学特征提取，得到初始声学特征；对所述初始声学特征进行特征层级划分，得到多个语音层级特征，并对多个所述语音层级特征进行层次化注意力处理，得到目标语音特征；对所述目标语音特征进行情感特征提取，得到多个语音情感特征；获取目标语音场景，将多个所述语音情感特征映射至所述目标语音场景中，并识别映射后的目标语音场景中的目标语音情感轨迹。本发明提高了语音情感识别的准确度和效率。

技术关键词

语音情感识别方法声学特征情感特征语音特征语音编码场景层级信号编码注意力融合时空特征频谱特征语音情感识别装置语音语义技术情感类别特征提取模块轨迹编码特征时域特征