用于视频分镜打标的方法及装置、电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
用于视频分镜打标的方法及装置、电子设备
申请号:CN202511083872
申请日期:2025-08-04
公开号:CN120769108A
公开日期:2025-10-10
类型:发明专利
摘要
本申请涉及视频处理技术领域,公开一种用于视频分镜打标的方法及装置、电子设备,其中,方法包括:根据视频画面的变化程度,对原始视频进行切分,获得多个视频分镜;在每个视频分镜中,提取多模态特征信息;基于多模态大语言模型,根据每个视频分镜的多模态特征信息分别进行标签内容提取,实现对每个视频分镜的标注。根据视频画面的变化程度来切分视频分镜,能够对视频内容进行精确的切分。在每个视频分镜中从多个维度对视频内容进行分析,提取多模态特征信息,全面反映视频内容的特性。最后基于多模态大语言模型对多模态特征信息进行标签内容提取,能够更准确地理解视频内容,灵活地适应不同的视频内容和标注需求,实现更高精度的视频分镜打标。
技术关键词
视频 多模态特征 电子设备本体 大语言模型 自定义标签 画面 文本 视觉 图像分析 语音 分段 处理器 程序 指令 语义 音频