摘要
本发明涉及语音语义技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了基于目标场景的语音情感识别方法、装置、设备及介质,所述方法包括:获取初始语音信号,对所述初始语音信号进行信号编码,得到语音编码特征;对所述语音编码特征进行声学特征提取,得到初始声学特征;对所述初始声学特征进行特征层级划分,得到多个语音层级特征,并对多个所述语音层级特征进行层次化注意力处理,得到目标语音特征;对所述目标语音特征进行情感特征提取,得到多个语音情感特征;获取目标语音场景,将多个所述语音情感特征映射至所述目标语音场景中,并识别映射后的目标语音场景中的目标语音情感轨迹。本发明提高了语音情感识别的准确度和效率。