一种基于人声数据进行迁移学习的海洋哺乳动物声音分类方法
申请号:CN202411440452
申请日期:2024-10-15
公开号:CN119360861A
公开日期:2025-01-24
类型:发明专利
摘要
海洋哺乳动物声音由于缺乏带注释的训练数据,目前难以使用有监督方式训练的大规模神经网络模型。受到人类声音和海洋哺乳动物声音重叠频率的启发,我们发明了Man2Marine方法,使用大量未注释的人声来预训练自监督大模型,然后使用海洋哺乳动物的声音对其进行微调。同时为了解决预训练自监督大模型中的过度参数化,难以应用的问题,使用了知识蒸馏技术来压缩模型参数。该方法显着降低了获取海洋哺乳动物声音数据的成本,为海洋哺乳动物声音研究提供了一种有实际应用价值的方法。
技术关键词
海洋哺乳动物
声音分类方法
人声
音频
模拟噪声
水下设备
知识蒸馏技术
采样率
数据
背景噪声
标签
生物声学
卷积编码器
语音
神经网络模型
参数
教师