基于音频和图像的人脸伪造识别方法、装置、设备及介质

申请号：CN202510851017

申请日期：2025-06-24

公开号：CN120356074B

公开日期：2025-08-19

类型：发明专利

摘要

本发明提供了一种基于音频和图像的人脸伪造识别方法、装置、设备及介质，涉及人脸伪造识别技术领域，方法包括提取待识别的人脸视频数据中的图像数据和音频数据，构建全局图像；将全局图像输入至训练好的人脸伪造识别模型中，得到人脸伪造识别结果，其中，人脸伪造识别模型包括：全局特征编码器，用于提取全局图像中图像数据和音频数据的全局特征向量；全局区域编码器，用于构建头部区域特征集合、面部区域特征集合以及唇部特写特征集合；区域感知模块，用于构建权重集合；特征融合模块，用于生成融合特征；多层感知机分类器，用于根据融合特征，输出人脸伪造识别结果。本发明以音频角度和图像角度进行人脸伪造识别，提升了识别的准确性。

技术关键词

伪造识别方法人脸图像音频感知损失函数融合特征数据残差神经网络多层感知机唇部特征编码器视频头部特征面部特征注意力机制分类器识别装置模块存储计算机程序

系统为您推荐了相关专利信息

内窥镜图像的血管增强方法、装置、电子设备及存储介质

内窥镜像素点饱和度通道 RGB特征

一种基于人工智能的图像处理方法及系统

图像处理模块图像处理方法图像输出模块 K均值聚类算法图像处理系统

基于多模态大模型的执行器运动控制性能优化方法、装置、介质及设备

控制性能优化方法编码向量执行器性能优化装置多模态信息

一种基于机器学习的芒果虫害检测方法、装置及设备

最佳特征关键点鲸鱼优化算法植物虫害检测虫害检测装置

基于云平台及边缘计算的车辆救援管理方法及系统

边缘计算站风险车辆服务站云平台