基于多模态融合的语音质量检测评估方法

申请号：CN202510465369

申请日期：2025-04-15

公开号：CN120319272A

公开日期：2025-07-15

类型：发明专利

摘要

本发明涉及语音质量检测技术领域，具体涉及基于多模态融合的语音质量检测评估方法。该方法包括：将多模态融合的含噪语音信号经过短时傅里叶变换得到若干个含噪语谱，构建含噪语音的复数谱矩阵；基于含噪语音的复数谱矩阵计算得到多模态融合的含噪语音信号对应的实值语音特征矩阵，将实值语音特征矩阵输入到多模态融合的语音信号重构分析模型中，输出最优实值语音特征；以最优实值语音特征为目标训练深度网络，实现语音增强；基于增强后的语音信号计算融合特定人信息的先验信噪比，基于先验信噪比对该语音信号进行质量检测评估，能够提高对多模态融合的语音信号方面进行质量检测评估时的可靠性和准确性。

技术关键词

检测评估方法语音特征多模态信噪比短时傅里叶变换重构矩阵数据样本集合信号深度网络模型频段分段指数节点编码器频率生成特征