跨模态对抗生成的中文声调纠错系统及其方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
跨模态对抗生成的中文声调纠错系统及其方法
申请号:CN202510907537
申请日期:2025-07-02
公开号:CN120412556B
公开日期:2025-08-26
类型:发明专利
摘要
本发明涉及语音处理技术领域,特别是涉及跨模态对抗生成的中文声调纠错系统及其方法,系统包括多通道声调频谱特化分解模块,用于并行处理语音信号,提取多尺度声调特征;自适应频谱注意力掩码模块,生成频谱增强掩码,对与声调特征相关的频率区域进行动态增强;声调表征模块,通过对比学习生成声调表征向量;声调错误检测模块,分析声调表征向量确定声调错误类型和错误模式;多模态反馈模块,基于声调错误类型和错误模式生成声调发音与舌位动作综合指导反馈,提高声调错误检测准确率,该系统通过多通道声调频谱特化分解和自适应频谱注意力掩码技术,将声调错误检出率提升至95%,准确率达92%,特别是对第三声的检测准确率显著提高。
技术关键词
错误检测模块 频谱特征 纠正策略 纠错系统 低频段 多通道 发音 跨模态 注意力机制 多尺度特征提取 多模态 声调轮廓 语音 编码器单元 生成多尺度 样本