摘要
本发明涉及一种基于图文多模态的人物形象丑化检测方法,适用于图像检测识别技术领域。该方法将待检测图文输入经训练的丑化判别器,得到待检测图文的人物形象丑化检测结果;所述丑化判别器,包括:图像侧模型,用于提取图文中图像的图像语义特征;文本OCR特征提取器,用于识别图像中的文本,并提取文本的文本语义特征;文本侧模型,用于提取图文中文本的文本向量特征;丑化判别网络,用于基于多源融合特征,输出人物形象丑化检测结果,其中多源融合特征基于图像侧模型提取的图像语义特征和文本OCR特征提取器提取的文本语义特征形成。本发明实现对人物形象丑化结果做出高精度判断的同时,能够识别出丑化的具体内容描述。