基于双感知卷积和频率增强注意力的语音欺骗检测方法

申请号：CN202510665629

申请日期：2025-05-22

公开号：CN120412645A

公开日期：2025-08-01

类型：发明专利

摘要

本发明公开了一种基于双感知卷积和频率增强注意力的深度伪造语音欺骗检测方法，在训练阶段需要获取训练语料并进行预处理，构建深度伪造语音欺骗检测模型，检测模型包括特征提取和语音分类两大部分，将训练语料的声学特征输入到分类检测模型中进行模型训练。本发明的检测模型在特征提取中提出了双感知卷积模块，该模块增强了模型对局部重要特征的选择性。双感知卷积模块在基线模型的卷积块之间增加了结合通道注意力和空间注意力的残差连接，能够自适应地调整特征权重，使模型关注于伪造语音的关键区域。通道注意力模块能够有效增强对关键特征通道的选择能力，而空间注意力模块能够优化特征图在空间维度上的关注区域，从而提高语音欺骗检测的准确性。

技术关键词

语音欺骗检测注意力滤波器卷积模块特征提取模块频率通道 Sinc函数编码模块检测模型训练索引离散余弦变换全局平均池化编码器模型预测值采样率声学特征

系统为您推荐了相关专利信息

一种基于深度学习的葡萄树体长势估计方法、系统、设备及介质

特征提取模型估计方法关键特征点图论算法节点

Web API推荐方法和装置

语义特征节点矩阵数据推荐方法

基于序列分解与多尺度注意力机制的长期时间序列预测方法及装置

多尺度注意力机制时间序列预测方法人工智能技术编码矩阵

一种用于Transformer实例分割模型的训练方法

查询特征注意力实例分割模型匈牙利匹配算法阶段

一种基于跨语言集成的零样本文本分类方法

文本分类方法多语言标签预测类别文本编码器