一种基于模型融合的声学场景分类方法及系统、电子设备

申请号：CN202411569824

申请日期：2024-11-06

公开号：CN119152883A

公开日期：2024-12-17

类型：发明专利

摘要

本发明涉及声学场景分类方案设计技术领域，具体涉及一种基于模型融合的声学场景分类方法及系统、电子设备。本发明搭建了三种分类模型，并将本发明搭建的三个模型进行融合使用，将十类声学场景进一步划分为三大类，并构建了一个三分类器用于学习相似场景间的上层共享特征。在三分类器和十分类器中均引入数据增强和模型融合策略，搭建了一个基于模型融合的多层次声学场景分类模型，本发明将十分类器与三分类器的输出在后期进行融合以提升模型整体性能，很大程度上提高了声学场景分类的准确性和可靠性，实现了针对声学场景分类问题在跨设备情况下提高神经网络模型的泛化性能及分类准确率。

技术关键词

声学场景分类方法残差网络分类器注意力计算机可读指令方案设计技术频率通道 ReLU函数噪声源频段电子设备分类准确率城市公园神经网络模型有轨电车融合策略分类系统

系统为您推荐了相关专利信息

基于深层特征的医学图像增强方法、装置、设备和介质

医学图像增强方法低分辨率医学图像特征提取模块 Sigmoid函数生成高分辨率

一种业务中台服务安全智能控制系统及方法

智能控制方法高维特征向量时序特征多模态深度学习前馈神经网络

基于图像语义分割与时序对齐的SPR响应区域识别方法

区域识别方法图像语义分割动态时间规整方法时序特征掩膜

一种基于小波变换与Transformer网络的物资监督数据异常值识别方法

值识别方法网络异常数据聚类注意力机制

一种基于深度学习的地外行星生命痕迹的识别方法及系统

图片识别方法多尺度特征注意力变换块