摘要
本发明提供一种基于音频摘要的鼾声阻塞部位分类方法,旨在解决现有鼾声分析中数据冗余和分类准确性的问题,为睡眠呼吸暂停综合征的诊断提供可靠的技术支持。通过五个核心模块实现从整夜音频数据中提取关键鼾声片段并进行阻塞部位识别:第一,对麦克风录制的整夜音频信号进行预加重和滑窗分帧等预处理以及生成梅尔频谱图。第二,基于预训练的openL3网络,该模块接收预处理生成的梅尔频谱图作为输入,通过多层卷积网络进行特征提取。第三,基于声学深度特征,通过无监督学习方法实现鼾声片段的聚类和重要性评估。第四,包括基于高斯混合模型的语音端点检测算法,提取非静音的鼾声片段。第五,采用在公开数据集MPSSC上预训练的深度学习网络实现鼾声阻塞部位的识别。