摘要
本申请公开了一种情绪类别的确定方法、装置、设备、存储介质和产品。该方法包括:获取音频数据;提取音频数据的MFCC特征,以及拼音音节的第一特征;将音频数据转化为文本,并确定文本中每个字的语调嵌入特征,以及文本的字嵌入特征、位置嵌入特征和段嵌入特征;将MFCC特征、第一特征、语调嵌入特征、字嵌入特征、位置嵌入特征和段嵌入特征进行融合,得到第二特征;将第二特征输入至情绪识别模型中,根据情绪识别模型中预设特征和预设情绪类别的关系信息,确定与第二特征对应的目标情绪类别。融合了基于人耳听觉特性的语音特征、文本特征、语调特征和声调特征等多种特征,提高了确定音频数据的情绪类别的准确率。