摘要
本发明公开了一种基于双感知卷积和频率增强注意力的深度伪造语音欺骗检测方法,在训练阶段需要获取训练语料并进行预处理,构建深度伪造语音欺骗检测模型,检测模型包括特征提取和语音分类两大部分,将训练语料的声学特征输入到分类检测模型中进行模型训练。本发明的检测模型在特征提取中提出了双感知卷积模块,该模块增强了模型对局部重要特征的选择性。双感知卷积模块在基线模型的卷积块之间增加了结合通道注意力和空间注意力的残差连接,能够自适应地调整特征权重,使模型关注于伪造语音的关键区域。通道注意力模块能够有效增强对关键特征通道的选择能力,而空间注意力模块能够优化特征图在空间维度上的关注区域,从而提高语音欺骗检测的准确性。