一种面向音频的关键语义信息检测方法

申请号：CN202411874082

申请日期：2024-12-19

公开号：CN119360836A

公开日期：2025-01-24

类型：发明专利

摘要

本发明公开了一种面向音频的关键语义信息检测方法，属于语音识别技术领域。本发明基于的关键语义信息检测模型包括识别网络和多个与预定义的关键词一一对应的分类器。所述识别网络用于输出待检测音频中每一帧各自对应的音频特征，各音频特征同时输入至所有的分类器中。所述分类器用于判断输入的音频特征包含该分类器对应的关键词的概率。对于任一帧，将所有分类器输出的概率组合成与该帧相对应的概率集合。对所述关键语义信息检测模型训练时，使用精细化池化损失策略作为训练目标。本发明通过采用精细化池化损失和关键词时序检测模块等手段，提高了计算效率，并降低了关键词位置对检测效果的影响。

技术关键词

信息检测方法音频特征声学特征语义分类器关键词时间域检测模型训练模块时序语音识别技术网络因子策略样本非线性标签矩阵

系统为您推荐了相关专利信息

一种基于域适应的遥感影像跨域语义分割方法

语义分割模型输出级数据语义分割方法特征提取器

一种计量体系认证管理系统及方法

资料均匀分布特征图谱认证管理系统样本

一种用于社交网络挖掘的无损图摘要方法、电子设备及程序产品

摘要方法顶点节点层次聚类方法社交网络图

一种信息查询场景的测试方法、装置、设备及介质

测试场景查询场景测试方法测试接口跨模态

一种基于大语言模型的运维日志的分析问答方法和装置

日志分析日志数据库日志监控分布式语义分布式消息系统