摘要
本发明提供一种多模态内容审查方法、设备、介质及计算机程序,涉及内容审查技术领域。该多模态内容审查方法包括:调用专用识别模型识别目标审查内容中的字幕及语音,得到文字识别结果和语音识别结果;专用识别模型为基于内容样本及内容样本的字幕标签、语音标签学习得到的模型;调用人工智能大模型,按照违规审查规则,对文字识别结果、语音识别结果以及目标审查内容的视频画面进行融合分析推理,输出违规行为识别结果。本发明基于人工智能大模型良好的认知能力提高了内容审查方法的通用性;将人工智能大模型与专用小模型进行有机结合,充分发挥了人工智能大模型的理解认知能力以及专用小模型的感知能力,实现了对内容的准确有效审查。