基于机器学习的婴幼儿哭声增强方法、装置及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于机器学习的婴幼儿哭声增强方法、装置及设备
申请号:CN202411080693
申请日期:2024-08-08
公开号:CN118609605B
公开日期:2024-10-18
类型:发明专利
摘要
本发明涉及音频处理技术领域,解决了现有技术中收集到的婴幼儿哭声受限于杂音的干扰,难以准确区分和提取出有效婴幼儿哭声的问题,提供了一种基于机器学习的婴幼儿哭声增强方法、装置及设备。该方法包括:获取第一音频数据,其中,所述第一音频数据包括至少一段含有婴幼儿哭声的音频数据;对所述第一音频数据进行预处理,得到第一音频数据对应的频谱图;将所述频谱图输入自编码器模型,输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息;根据所述音频特征信息,对含有婴幼儿哭声的音频数据进行处理,得到增强后的第二音频数据。本发明有效地从嘈杂环境中提取并增强了婴幼儿哭声,显著提高了哭声信号的纯净度和识别率。
技术关键词
音频特征信息 编码器 计算机程序指令 时域音频信号 传播算法 正则化参数 重构 分段 采样率 特征提取模块 数据获取模块 表达式 处理器 存储器 矩阵 电子设备