摘要
本申请公开了一种视频检索方法及装置、电子设备、存储介质,所述方法包括:获取当前的各个待检索视频;将各个待检索视频分成多个分镜视频;针对每个目标检索维度,获取各个分镜视频的目标检索维度的文本描述;其中,目标检索维度包括字幕维度、音频维度及视觉维度;一个分镜视频的视觉维度的文本描述由分镜视频的上下文文本描述与分镜视频的各帧关键帧的文本描述组合;将各个分镜视频的目标检索维度的文本描述与检索问题结合,进行检索增强,得到基于目标检索维度的多个检索视频;将各个检索视频的各个目标检索维度的文本描述进行加权,得到多个分镜多维度文本描述;将各个分镜多维度文本描述与检索问题结合进行检索增强,得到最终检索结果。