一种用于智能语音控制器的可变比特率量化语音识别方法
申请号:CN202511081046
申请日期:2025-08-04
公开号:CN120727015A
公开日期:2025-09-30
类型:发明专利
摘要
本发明涉及一种用于智能语音控制器的可变比特率量化语音识别方法,应用于包括目标传感阵列的第一端。第一端通过语音采集模块动态采集带噪语音信号,在检测到信号时,借助时域特征单元和频域特征单元分别采集时域特征和频域特征。这些特征发送至第二端,第二端融合特征生成增强语音信号,并进行可变比特率量化编码,随后通过变换解码结构输出文本转录结果。该方法在复杂噪声环境下实现高效、准确的语音识别,具备自适应比特率分配能力,显著提升传输效率和识别鲁棒性,适用于智能家居等场景。
技术关键词
时域特征
频域特征
智能语音控制器
带噪语音信号
语音识别方法
语音采集模块
阵列
融合特征
文本
传感
注意力机制
解码器结构
解码结构
编码器
数据