基于音频和图像的人脸伪造识别方法、装置、设备及介质
申请号:CN202510851017
申请日期:2025-06-24
公开号:CN120356074B
公开日期:2025-08-19
类型:发明专利
摘要
本发明提供了一种基于音频和图像的人脸伪造识别方法、装置、设备及介质,涉及人脸伪造识别技术领域,方法包括提取待识别的人脸视频数据中的图像数据和音频数据,构建全局图像;将全局图像输入至训练好的人脸伪造识别模型中,得到人脸伪造识别结果,其中,人脸伪造识别模型包括:全局特征编码器,用于提取全局图像中图像数据和音频数据的全局特征向量;全局区域编码器,用于构建头部区域特征集合、面部区域特征集合以及唇部特写特征集合;区域感知模块,用于构建权重集合;特征融合模块,用于生成融合特征;多层感知机分类器,用于根据融合特征,输出人脸伪造识别结果。本发明以音频角度和图像角度进行人脸伪造识别,提升了识别的准确性。
技术关键词
伪造识别方法
人脸
图像
音频
感知损失函数
融合特征
数据
残差神经网络
多层感知机
唇部特征
编码器
视频
头部特征
面部特征
注意力机制
分类器
识别装置
模块
存储计算机程序