一种基于融合特征降维的Fca-ProRes2Net说话人识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于融合特征降维的Fca-ProRes2Net说话人识别方法
申请号:CN202410734797
申请日期:2024-06-07
公开号:CN118588087A
公开日期:2024-09-03
类型:发明专利
摘要
本发明请求保护一种基于融合特征降维的Fca‑ProRes2Net说话人识别方法,包括步骤:S1,将语音信号进行预处理,得到适合提取说话人特征的语音信号,并将MFCC、GFCC以及它们的动态特征参数构成一种新的混合参数,该特征参数囊括了中高频以及动静态特征;S2,利用2DPCA对特征矩阵降维整合得到MMGFCC;S3,采用多尺度全连接的Res2Net网络来获取更大范围的感受野;S4,在主干网络ProRes2Net中加入频率域通道注意力网络:FcaNet,引入更多的频率分量信息;S5,运用Softmax函数对输出结果进行分类处理,之后使用交叉熵损失函数来寻求最优权重参数,最终得到优化的说话人识别模型。本发明可以有效地提取出表征能力强的特征参数并能高效地识别,提高了识别能力和泛化能力。
技术关键词
说话人识别方法 Softmax函数 说话人识别模型 融合特征 动静态特征 二维主成分分析 非暂态计算机可读存储介质 梅尔频率倒谱系数 语音特征 残差网络 多尺度 矩阵 信号 离散余弦变换 注意力 通道
系统为您推荐了相关专利信息
核反应堆堆芯 数字孪生 数据驱动模型 数据驱动方法 卷积网络提取高维特征
变循环发动机 硬件加速方法 FPGA开发板 数据输入模块 故障诊断模块
监督深度学习 频域特征 融合特征 仿真模型 多层感知器网络
特征提取网络 掌静脉图像 加权特征 图像识别方法 融合特征
融合特征 语义 多模态 编码器 跨模态