基于深度学习的视频内容分析方法、设备、介质及产品

申请号：CN202411904060

申请日期：2024-12-23

公开号：CN119763014A

公开日期：2025-04-04

类型：发明专利

摘要

本申请涉及视频处理领域，公开了一种基于深度学习的视频内容分析方法。通过获取原始视频文件，将原始视频文件进行解码得到目标视频文件；对目标视频文件进行初步检测，获取目标视频文件的基本信息；依据目标视频文件的基本信息进行自适应采样，将目标视频文件转换为帧图像数组；采用时空金字塔注意力网络对镜头衔接点进行检测，依据检测到的镜头衔接点将帧图像数组切分为至少两个片段；采用动态对比学习框架，从每个片段中抽取关键帧图像；采用上下文感知的多任务学习网络对关键帧图像进行字幕移除处理，采用循环渐进式多模态对齐网络对关键帧图像生成图像描述。可以至少用以解决现有技术的局限性，提供更高效、更准确的视频内容分析解决方案。

技术关键词

视频内容分析方法关键帧多任务学习网络图像字幕多模态镜头金字塔计算机程序指令动态注意力框架校准技术计算机程序产品处理器代表电子设备

系统为您推荐了相关专利信息

立体显微镜的多目相机标定方法及相关装置

多目相机标定板图像立体显微镜相机标定方法可执行程序代码

基于OCR技术的工艺图纸识别和层级BOM生成方法及系统

图纸文本检测模型文本识别模型层级生成方法

高精准度多语言实时同传字幕生成方法

字幕生成方法多语言机器翻译模型投影仪屏幕

基于肿瘤早期筛查的肿瘤细胞形态分类方法及存储介质

形态分类方法肿瘤早期筛查医疗影像数据误差矩阵图像

一种基于卷积神经网络的疲劳驾驶检测系统及方法

疲劳驾驶检测系统图像数据预处理疲劳状态检测数据采集模块特征提取模块