基于图文多模态的人物形象丑化检测方法

申请号：CN202510758545

申请日期：2025-06-09

公开号：CN120279397A

公开日期：2025-07-08

类型：发明专利

摘要

本发明涉及一种基于图文多模态的人物形象丑化检测方法，适用于图像检测识别技术领域。该方法将待检测图文输入经训练的丑化判别器，得到待检测图文的人物形象丑化检测结果；所述丑化判别器，包括：图像侧模型，用于提取图文中图像的图像语义特征；文本OCR特征提取器，用于识别图像中的文本，并提取文本的文本语义特征；文本侧模型，用于提取图文中文本的文本向量特征；丑化判别网络，用于基于多源融合特征，输出人物形象丑化检测结果，其中多源融合特征基于图像侧模型提取的图像语义特征和文本OCR特征提取器提取的文本语义特征形成。本发明实现对人物形象丑化结果做出高精度判断的同时，能够识别出丑化的具体内容描述。

技术关键词

图文语义特征多模态文本图像特征提取器多源融合预训练模型检测识别技术人脸检测方法多分支样本编码器数据分布处理器检测设备存储器参数