基于深度学习的视频内容分析方法、设备、介质及产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于深度学习的视频内容分析方法、设备、介质及产品
申请号:CN202411904060
申请日期:2024-12-23
公开号:CN119763014A
公开日期:2025-04-04
类型:发明专利
摘要
本申请涉及视频处理领域,公开了一种基于深度学习的视频内容分析方法。通过获取原始视频文件,将原始视频文件进行解码得到目标视频文件;对目标视频文件进行初步检测,获取目标视频文件的基本信息;依据目标视频文件的基本信息进行自适应采样,将目标视频文件转换为帧图像数组;采用时空金字塔注意力网络对镜头衔接点进行检测,依据检测到的镜头衔接点将帧图像数组切分为至少两个片段;采用动态对比学习框架,从每个片段中抽取关键帧图像;采用上下文感知的多任务学习网络对关键帧图像进行字幕移除处理,采用循环渐进式多模态对齐网络对关键帧图像生成图像描述。可以至少用以解决现有技术的局限性,提供更高效、更准确的视频内容分析解决方案。
技术关键词
视频内容分析方法 关键帧 多任务学习网络 图像 字幕 多模态 镜头 金字塔 计算机程序指令 动态 注意力 框架 校准技术 计算机程序产品 处理器 代表 电子设备
系统为您推荐了相关专利信息
多目相机 标定板图像 立体显微镜 相机标定方法 可执行程序代码
图纸 文本检测模型 文本识别模型 层级 生成方法
字幕生成方法 多语言 机器翻译模型 投影仪 屏幕
形态分类方法 肿瘤早期筛查 医疗影像数据 误差矩阵 图像
疲劳驾驶检测系统 图像数据预处理 疲劳状态检测 数据采集模块 特征提取模块