离线语音数据的处理方法及装置、设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
离线语音数据的处理方法及装置、设备和存储介质
申请号:CN202511024911
申请日期:2025-07-24
公开号:CN120977293A
公开日期:2025-11-18
类型:发明专利
摘要
本申请涉及一种离线语音数据的处理方法及装置、设备和存储介质,其中,该方法包括:利用麦克风阵列进行语音数据的多样化采集;对采集到的语音数据进行自适应滤波降噪,并对降噪处理后的语音数据进行端点检测以确定出语音数据中的语音起点和语音终点,以及对进行端点检测后的语音数据中的连续数据进行分帧加窗,最后从分帧加窗后的数据中进行梅尔频率倒谱系数和高阶特征提取并融合,得到预处理后的语音数据;基于预处理后的语音数据对语音识别模型进行训练;对训练后的语音识别模型通过模型剪枝和低秩分解,以及参数进行共享,最后对进行参数共享后的语音识别模型进行重训练;基于重训练后的语音识别模型对实时输入的离线语音数据进行处理。
技术关键词
语音识别模型 长短期记忆网络 梅尔频率倒谱系数 数据 麦克风阵列 模型剪枝 指向麦克风 离线 端点 计算机可执行指令 重构 滤波器 注意力 输出特征 终点 通信接口 参数 冗余