基于双感知卷积和频率增强注意力的语音欺骗检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于双感知卷积和频率增强注意力的语音欺骗检测方法
申请号:CN202510665629
申请日期:2025-05-22
公开号:CN120412645A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种基于双感知卷积和频率增强注意力的深度伪造语音欺骗检测方法,在训练阶段需要获取训练语料并进行预处理,构建深度伪造语音欺骗检测模型,检测模型包括特征提取和语音分类两大部分,将训练语料的声学特征输入到分类检测模型中进行模型训练。本发明的检测模型在特征提取中提出了双感知卷积模块,该模块增强了模型对局部重要特征的选择性。双感知卷积模块在基线模型的卷积块之间增加了结合通道注意力和空间注意力的残差连接,能够自适应地调整特征权重,使模型关注于伪造语音的关键区域。通道注意力模块能够有效增强对关键特征通道的选择能力,而空间注意力模块能够优化特征图在空间维度上的关注区域,从而提高语音欺骗检测的准确性。
技术关键词
语音欺骗检测 注意力 滤波器 卷积模块 特征提取模块 频率 通道 Sinc函数 编码模块 检测模型训练 索引 离散余弦变换 全局平均池化 编码器 模型预测值 采样率 声学特征
系统为您推荐了相关专利信息
特征提取模型 估计方法 关键特征点 图论算法 节点
语义特征 节点 矩阵 数据 推荐方法
多尺度注意力机制 时间序列预测方法 人工智能技术 编码 矩阵
查询特征 注意力 实例分割模型 匈牙利匹配算法 阶段
文本分类方法 多语言 标签 预测类别 文本编码器