一种基于模型融合的声学场景分类方法及系统、电子设备
申请号:CN202411569824
申请日期:2024-11-06
公开号:CN119152883A
公开日期:2024-12-17
类型:发明专利
摘要
本发明涉及声学场景分类方案设计技术领域,具体涉及一种基于模型融合的声学场景分类方法及系统、电子设备。本发明搭建了三种分类模型,并将本发明搭建的三个模型进行融合使用,将十类声学场景进一步划分为三大类,并构建了一个三分类器用于学习相似场景间的上层共享特征。在三分类器和十分类器中均引入数据增强和模型融合策略,搭建了一个基于模型融合的多层次声学场景分类模型,本发明将十分类器与三分类器的输出在后期进行融合以提升模型整体性能,很大程度上提高了声学场景分类的准确性和可靠性,实现了针对声学场景分类问题在跨设备情况下提高神经网络模型的泛化性能及分类准确率。
技术关键词
声学场景分类方法
残差网络
分类器
注意力
计算机可读指令
方案设计技术
频率
通道
ReLU函数
噪声源
频段
电子设备
分类准确率
城市公园
神经网络模型
有轨电车
融合策略
分类系统