基于帧级别的小样本声音事件检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于帧级别的小样本声音事件检测方法
申请号:CN202411527937
申请日期:2024-10-30
公开号:CN119479653B
公开日期:2025-05-13
类型:发明专利
摘要
本发明涉及一种基于帧级别的小样本声音事件检测方法。包括:提供待检的目标音频信号,并对所述目标音频信号执行音频信号第一预处理,以提取得到所述目标音频信号的目标信号特征集;将上述提取得到的目标信号特征集加载到构建的小样本声音事件检测模型,以利用所述小样本声音事件检测模型对目标音频信号进行声音事件检测,以生成当前目标信号PCEN声纹特征内每个音频帧对应的预测帧状态;基于所有目标信号PCEN声纹特征对应的预测帧状态,确定目标音频信号所包含的声音事件类别以及每个声音事件类别对应的时间起止点。本发明能有效实现对小样本声音事件检测,检测精度高。
技术关键词
声音事件检测方法 声纹特征 分类器 事件检测模型 样本 信息交互网络 信号特征 音频特征 数据 二次特征 拼接模块 注意力 训练特征 混合域 通道 拼接器 特征提取网络