摘要
本发明公开了一种面向音频的关键语义信息检测方法,属于语音识别技术领域。本发明基于的关键语义信息检测模型包括识别网络和多个与预定义的关键词一一对应的分类器。所述识别网络用于输出待检测音频中每一帧各自对应的音频特征,各音频特征同时输入至所有的分类器中。所述分类器用于判断输入的音频特征包含该分类器对应的关键词的概率。对于任一帧,将所有分类器输出的概率组合成与该帧相对应的概率集合。对所述关键语义信息检测模型训练时,使用精细化池化损失策略作为训练目标。本发明通过采用精细化池化损失和关键词时序检测模块等手段,提高了计算效率,并降低了关键词位置对检测效果的影响。