基于机器学习的婴幼儿哭声增强方法、装置及设备

申请号：CN202411080693

申请日期：2024-08-08

公开号：CN118609605B

公开日期：2024-10-18

类型：发明专利

摘要

本发明涉及音频处理技术领域，解决了现有技术中收集到的婴幼儿哭声受限于杂音的干扰，难以准确区分和提取出有效婴幼儿哭声的问题，提供了一种基于机器学习的婴幼儿哭声增强方法、装置及设备。该方法包括：获取第一音频数据，其中，所述第一音频数据包括至少一段含有婴幼儿哭声的音频数据；对所述第一音频数据进行预处理，得到第一音频数据对应的频谱图；将所述频谱图输入自编码器模型，输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息；根据所述音频特征信息，对含有婴幼儿哭声的音频数据进行处理，得到增强后的第二音频数据。本发明有效地从嘈杂环境中提取并增强了婴幼儿哭声，显著提高了哭声信号的纯净度和识别率。

技术关键词

音频特征信息编码器计算机程序指令时域音频信号传播算法正则化参数重构分段采样率特征提取模块数据获取模块表达式处理器存储器矩阵电子设备