一种基于基因学习模型的曲艺视频标注方法

申请号：CN202410717013

申请日期：2024-06-04

公开号：CN118823627A

公开日期：2024-10-22

类型：发明专利

摘要

本发明公开了一种基于基因学习模型的曲艺视频标注方法，本方法包括以下步骤：S1、提取视频的关键帧，记录关键帧在曲艺视频所有帧中的下标，计算当前关键帧的时间，并将关键帧输入特征提取网络进行特征提取；S2、分离曲艺视频的音频，提取音频特征；S3、将每个关键帧的视觉特征以及音频特征进行同步聚合，得到每帧的多模态融合特征，对所有关键帧的多模态融合特征进行时序聚合，得到视频级时序聚合特征；S4、根据得到的视频级时序聚合特征进行推理，得到视频级特征，根据得到的关键帧特征进行推理得到视频帧级特征；本发明可以实现对传统曲艺视频的多粒度标注，有助于后续对该视频的管理、检索，有利于传播中华文化。

技术关键词

视频标注方法音频特征提取融合特征特征提取网络视觉特征基因时序代表关键帧提取技术视频关键帧提取多模态 Gabor滤波器图像视频帧特征提取算法通道

系统为您推荐了相关专利信息

一种医疗辅助智能机械人及智慧医疗系统

智能机械人分类识别模型执行交互指令智慧医疗系统生成上下文感知

一种资源动态分配方法、装置、设备及介质

资源动态分配方法深度学习网络业务系统性能指标数据资源动态分配装置

基于神经网络的冶炼过程优化控制系统及方法

优化控制系统注意力卷积神经网络模型深度神经网络模型速度控制器

一种燃气管网故障预测方法及设备

燃气管网故障融合特征梯度直方图交叉注意力机制时序特征

基于残差特征提取和对比驱动聚合的遥感图像分割方法

遥感图像分割方法图像分割模型驱动特征语义特征输出特征