基于Mel语谱图特征及SSA-TFSCNet语音情感识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于Mel语谱图特征及SSA-TFSCNet语音情感识别方法及系统
申请号:CN202511160982
申请日期:2025-08-19
公开号:CN120954456A
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了基于Mel语谱图特征及SSA‑TFSCNet的语音情感识别方法及系统,方法如下:S1.将音频信号提取为一维时序信号并进行预处理,得到每个音频对应的Mel语谱图,划分成训练集和验证集;S2.构建基础网络TFSC的基本框架,结合双重注意力机制,搭建可变参数的TFSCNet模型;S3.将训练集和TFSCNet模型输入SSA算法进行训练,并设置利用SSA算法寻参时TFSCNet模型的参数范围,利用验证集进行验证,通过SSA算法获得TFSCNet模型的最优参数;S4.将SSA算法寻得的最优参数应用于TFSCNet模型中,得到参数固定的TFSCNet模型;S5.将训练集数据输入TFSCNet模型进行训练,并用验证集进行验证,若符合验证条件的,停止训练,保存最佳模型;S6.将待测试语音信号进行处理生成Mel语谱图后,输入最佳模型,得到预测情感。
技术关键词
语音情感识别方法 SSA算法 训练集数据 参数 注意力机制 代表 频率 语音情感识别系统 位置更新 情感特征 音频 情感识别模型 短时傅里叶变换 信号 模块 ReLU函数 网络 索引 多层感知机