摘要
本申请提供的基于AI的营销视频审核方法,涉及AI营销视频审核技术领域,包括:获取多模态数据原始结构集合,并提取图像语义特征、语音表达特征、文本语义特征和场景标签信息,得出图像语义特征集合、视觉节奏特征集合、语音表达特征集合、音画同步关联向量结构、文本语义特征集合、字幕语义与图像主体联动关系图。通过构建图像语义特征集合、语音表达特征集合、文本语义特征集合与视觉节奏特征集合,并将其融合为多模态内容融合特征张量,可实现对AI营销视频在视觉、听觉与语义层面的统一建模,有效为后续的微观一致性检测、合规知识图谱与情绪语义冲突识别,从而对视频内容的全链路风险感知与精准审核。