基于图文多模态的人物形象丑化检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于图文多模态的人物形象丑化检测方法
申请号:CN202510758545
申请日期:2025-06-09
公开号:CN120279397A
公开日期:2025-07-08
类型:发明专利
摘要
本发明涉及一种基于图文多模态的人物形象丑化检测方法,适用于图像检测识别技术领域。该方法将待检测图文输入经训练的丑化判别器,得到待检测图文的人物形象丑化检测结果;所述丑化判别器,包括:图像侧模型,用于提取图文中图像的图像语义特征;文本OCR特征提取器,用于识别图像中的文本,并提取文本的文本语义特征;文本侧模型,用于提取图文中文本的文本向量特征;丑化判别网络,用于基于多源融合特征,输出人物形象丑化检测结果,其中多源融合特征基于图像侧模型提取的图像语义特征和文本OCR特征提取器提取的文本语义特征形成。本发明实现对人物形象丑化结果做出高精度判断的同时,能够识别出丑化的具体内容描述。
技术关键词
图文 语义特征 多模态 文本 图像 特征提取器 多源融合 预训练模型 检测识别技术 人脸检测方法 多分支 样本 编码器 数据分布 处理器 检测设备 存储器 参数