一种面向音频的关键语义信息检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种面向音频的关键语义信息检测方法
申请号:CN202411874082
申请日期:2024-12-19
公开号:CN119360836A
公开日期:2025-01-24
类型:发明专利
摘要
本发明公开了一种面向音频的关键语义信息检测方法,属于语音识别技术领域。本发明基于的关键语义信息检测模型包括识别网络和多个与预定义的关键词一一对应的分类器。所述识别网络用于输出待检测音频中每一帧各自对应的音频特征,各音频特征同时输入至所有的分类器中。所述分类器用于判断输入的音频特征包含该分类器对应的关键词的概率。对于任一帧,将所有分类器输出的概率组合成与该帧相对应的概率集合。对所述关键语义信息检测模型训练时,使用精细化池化损失策略作为训练目标。本发明通过采用精细化池化损失和关键词时序检测模块等手段,提高了计算效率,并降低了关键词位置对检测效果的影响。
技术关键词
信息检测方法 音频特征 声学特征 语义 分类器 关键词 时间域 检测模型训练 模块 时序 语音识别技术 网络 因子 策略 样本 非线性 标签 矩阵
系统为您推荐了相关专利信息
语义分割模型 输出级 数据 语义分割方法 特征提取器
资料 均匀分布特征 图谱 认证管理系统 样本
摘要方法 顶点 节点 层次聚类方法 社交网络图
测试场景 查询场景 测试方法 测试接口 跨模态
日志分析 日志数据库 日志监控 分布式语义 分布式消息系统