摘要
本发明涉及语音质量检测技术领域,具体涉及基于多模态融合的语音质量检测评估方法。该方法包括:将多模态融合的含噪语音信号经过短时傅里叶变换得到若干个含噪语谱,构建含噪语音的复数谱矩阵;基于含噪语音的复数谱矩阵计算得到多模态融合的含噪语音信号对应的实值语音特征矩阵,将实值语音特征矩阵输入到多模态融合的语音信号重构分析模型中,输出最优实值语音特征;以最优实值语音特征为目标训练深度网络,实现语音增强;基于增强后的语音信号计算融合特定人信息的先验信噪比,基于先验信噪比对该语音信号进行质量检测评估,能够提高对多模态融合的语音信号方面进行质量检测评估时的可靠性和准确性。