基于音频和图像的人脸伪造识别方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于音频和图像的人脸伪造识别方法、装置、设备及介质
申请号:CN202510851017
申请日期:2025-06-24
公开号:CN120356074B
公开日期:2025-08-19
类型:发明专利
摘要
本发明提供了一种基于音频和图像的人脸伪造识别方法、装置、设备及介质,涉及人脸伪造识别技术领域,方法包括提取待识别的人脸视频数据中的图像数据和音频数据,构建全局图像;将全局图像输入至训练好的人脸伪造识别模型中,得到人脸伪造识别结果,其中,人脸伪造识别模型包括:全局特征编码器,用于提取全局图像中图像数据和音频数据的全局特征向量;全局区域编码器,用于构建头部区域特征集合、面部区域特征集合以及唇部特写特征集合;区域感知模块,用于构建权重集合;特征融合模块,用于生成融合特征;多层感知机分类器,用于根据融合特征,输出人脸伪造识别结果。本发明以音频角度和图像角度进行人脸伪造识别,提升了识别的准确性。
技术关键词
伪造识别方法 人脸 图像 音频 感知损失函数 融合特征 数据 残差神经网络 多层感知机 唇部特征 编码器 视频 头部特征 面部特征 注意力机制 分类器 识别装置 模块 存储计算机程序
系统为您推荐了相关专利信息
内窥镜 像素点 饱和度 通道 RGB特征
图像处理模块 图像处理方法 图像输出模块 K均值聚类算法 图像处理系统
控制性能优化方法 编码向量 执行器 性能优化装置 多模态信息
最佳特征 关键点 鲸鱼优化算法 植物虫害检测 虫害检测装置
边缘计算站 风险 车辆 服务站 云平台