一种基于梅尔频谱图的呼吸音分类方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于梅尔频谱图的呼吸音分类方法及系统
申请号:CN202411676171
申请日期:2024-11-22
公开号:CN119181388B
公开日期:2025-03-14
类型:发明专利
摘要
本申请涉及呼吸音识别领域,具体地公开了一种基于梅尔频谱图的呼吸音分类方法及系统,其利用具有新型网络结构的呼吸音分类模型来提升呼吸音分类的灵敏度与特异度。特别地,所述具有新型网络结构的呼吸音分类模型包括音频频谱图变换器网络、多尺度特征提取网络、时序特征提取网络和线性输出层网络,其中,所述多尺度特征提取网络和所述时序特征提取网络形成特征编解码架构对由所述音频频谱图变换器网络输出的呼吸音图谱特征进行全局特征与局部特征强化学习,据此来提升呼吸音分类的灵敏度与特异度。
技术关键词
识别呼吸音 分类方法 特征提取网络 多尺度特征提取 序列 融合类别信息 上采样 新型网络结构 预测类别 音频 标签 矩阵 编码向量 LSTM模型 变换器 重构 语义 Softmax函数