摘要
本发明涉及语音处理技术领域,特别是涉及跨模态对抗生成的中文声调纠错系统及其方法,系统包括多通道声调频谱特化分解模块,用于并行处理语音信号,提取多尺度声调特征;自适应频谱注意力掩码模块,生成频谱增强掩码,对与声调特征相关的频率区域进行动态增强;声调表征模块,通过对比学习生成声调表征向量;声调错误检测模块,分析声调表征向量确定声调错误类型和错误模式;多模态反馈模块,基于声调错误类型和错误模式生成声调发音与舌位动作综合指导反馈,提高声调错误检测准确率,该系统通过多通道声调频谱特化分解和自适应频谱注意力掩码技术,将声调错误检出率提升至95%,准确率达92%,特别是对第三声的检测准确率显著提高。