摘要
本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种音频信号真实性验证方法、装置、设备及介质,包括:构建原始音频文本数据集,并生成对抗样本集合,将原始音频文本数据集与对抗样本集合输入音频检测模型进行联合训练,得到经对抗训练的音频检测模型;获取待检测音频信号并提取其声学特征,获取与待检测音频信号关联的非声学特征,根据声学特征与非声学特征构建多维特征向量,将多维特征向量输入音频检测模型生成异常指标,基于异常指标执行分级响应操作。本发明通过引入对抗样本训练增强模型鲁棒性,并融合多模态特征构建多维特征向量,实现对语音克隆攻击的准确识别与分级响应。