基于拾音环境因素采集的音频数据增强方法、装置及介质
申请号:CN202411005494
申请日期:2024-07-25
公开号:CN118737172B
公开日期:2025-09-02
类型:发明专利
摘要
本发明公开了一种基于拾音环境因素采集的音频数据增强方法、装置及介质,获取待增强的原始音频数据的样本训练集;对所述样本训练集依次进行分批、验证、标签提取、合并操作;调度拾音器和扬声器在真实环境中对每个样本批次的整条音频数据混合拾音环境因素;对整段录音数据根据所述分批和所述标签提取的相应数据依次进行切分和标记,得到当前样本批次的增强样本训练集;获取每个样本批次的增强样本训练集,拼接得到最终的原始音频数据的增强样本训练集。优点:本发明同时考虑到了环境背景噪声,拾音器与声源之间的距离和拾音器内部产生的干扰等环境因素,更能有效引入环境信息,进而提高声音事件检测模型在真实环境中的准确率,减少性能下降。
技术关键词
样本
音频
训练集
拾音器
数据
扬声器
索引
事件检测模型
后处理模块
标签文件
标记
背景噪声
可读存储介质
程序
指令
日志
计算机