一种图文有害信息识别方法、装置、电子设备及存储介质
申请号:CN202510334786
申请日期:2025-03-20
公开号:CN120264053A
公开日期:2025-07-04
类型:发明专利
摘要
本公开提供了一种图文有害信息识别方法、装置、电子设备及存储介质,获取待识别图文数据,提取待识别图文数据中,图像模态数据对应的图像特征向量,并提取待识别图文数据中,文本模态数据对应的文本特征向量以及语义特征向量;将图像特征向量与文本特征向量融合生成图文融合特征,并将图像特征向量与语义特征向量融合生成语义融合特征;融合图文融合特征与语义融合特征生成待识别图文数据对应的目标特征,将目标特征输入至预先训练好的有害信息分类模型,确定待识别图文数据对应的有害信息检测结果。在保证特征表达能力的同时,实现了图文信息的深层语义对齐,有效提高了多模态有害信息识别的准确性和泛化能力。
技术关键词
图像特征向量
文本特征向量
融合特征
语义
生成图文
有害信息识别
数据
识别方法
注意力机制
前馈神经网络
机器可读指令
多层次特征提取
图像嵌入
电子设备
自然语言理解
序列
光学字符识别
跨模态