一种基于DMAAN的跨库语音情感识别方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于DMAAN的跨库语音情感识别方法及装置
申请号:CN202410725624
申请日期:2024-06-06
公开号:CN118351887A
公开日期:2024-07-16
类型:发明专利
摘要
本申请公开了一种基于DMAAN的跨库语音情感识别方法及装置,方法包括:提取待识别语音样本的语谱图特征;将所述语谱图特征输入训练好的基于深度多层对抗自适应网络DMAAN的跨库语音情感识别模型,得到语音情感识别结果;模型的获取方法包括:从第一语音情感数据库和第二语音情感数据库中提取具有相同情感标签的语音样本,分别作为源域语音样本和目标域语音样本,并提取样本的语谱图特征;构建基于DMAAN的跨库语音情感识别模型,通过在原始分类损失函数中加入边缘分布适配损失和条件分布适配损失来指导训练,从而消除不同领域间的分布差异;结合总损失函数,使用源域语音样本的语谱图特征和目标域语音样本的语谱图特征对模型进行训练。识别准确率更好。
技术关键词
语音情感识别模型 样本 标签 语谱图 语音情感识别方法 谱图特征 情感分类器 语音情感识别装置 参数 随机梯度下降 网络 计算方法 处理器 非线性 指令 滤波