基于多模态融合的语音质量检测评估方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态融合的语音质量检测评估方法
申请号:CN202510465369
申请日期:2025-04-15
公开号:CN120319272A
公开日期:2025-07-15
类型:发明专利
摘要
本发明涉及语音质量检测技术领域,具体涉及基于多模态融合的语音质量检测评估方法。该方法包括:将多模态融合的含噪语音信号经过短时傅里叶变换得到若干个含噪语谱,构建含噪语音的复数谱矩阵;基于含噪语音的复数谱矩阵计算得到多模态融合的含噪语音信号对应的实值语音特征矩阵,将实值语音特征矩阵输入到多模态融合的语音信号重构分析模型中,输出最优实值语音特征;以最优实值语音特征为目标训练深度网络,实现语音增强;基于增强后的语音信号计算融合特定人信息的先验信噪比,基于先验信噪比对该语音信号进行质量检测评估,能够提高对多模态融合的语音信号方面进行质量检测评估时的可靠性和准确性。
技术关键词
检测评估方法 语音特征 多模态 信噪比 短时傅里叶变换 重构矩阵 数据样本集合 信号 深度网络模型 频段 分段 指数 节点 编码器 频率 生成特征