用于视频分镜打标的方法及装置、电子设备

申请号：CN202511083872

申请日期：2025-08-04

公开号：CN120769108A

公开日期：2025-10-10

类型：发明专利

摘要

本申请涉及视频处理技术领域，公开一种用于视频分镜打标的方法及装置、电子设备，其中，方法包括：根据视频画面的变化程度，对原始视频进行切分，获得多个视频分镜；在每个视频分镜中，提取多模态特征信息；基于多模态大语言模型，根据每个视频分镜的多模态特征信息分别进行标签内容提取，实现对每个视频分镜的标注。根据视频画面的变化程度来切分视频分镜，能够对视频内容进行精确的切分。在每个视频分镜中从多个维度对视频内容进行分析，提取多模态特征信息，全面反映视频内容的特性。最后基于多模态大语言模型对多模态特征信息进行标签内容提取，能够更准确地理解视频内容，灵活地适应不同的视频内容和标注需求，实现更高精度的视频分镜打标。

技术关键词

视频多模态特征电子设备本体大语言模型自定义标签画面文本视觉图像分析语音分段处理器程序指令语义音频