一种视频内容识别自动分类的方法及系统

申请号：CN202411827597

申请日期：2024-12-12

公开号：CN119741636A

公开日期：2025-04-01

类型：发明专利

摘要

本发明公开了一种视频内容识别自动分类的方法及系统，方法包括S1、多模态特征提取：基于深度学习模型、音频处理技术和自然语言处理技术分别提取视频数据的视觉特征、音频特征和文本特征；S2、多模态信息融合：采用特征拼接或加权求和或深度学习融合的方式将提取到的视觉特征、音频特征和文本特征进行融合，得到视频的多模态特征表示；S3、视频分类：基于设置有领域对抗神经网络的深度学习分类器，对视频的多模态特征表示进行分类，获取视频的分类结果。优点是：通过采用深度学习算法，结合多模态信息融合技术，能够自动从视频中学习到有效的特征表示，从而提高视频分类的准确性。在复杂场景下，仍能保持较高的准确性。

技术关键词

模态特征多模态信息融合深度学习融合音频特征学习分类器深度学习模型文本卷积神经网络模型关键帧自然语言生成技术梅尔频率倒谱系数生成视频摘要序列视觉特征提取数据