摘要
本申请提供了一种主体‑文本联合查询的视频库片段检索方法和装置,涉及计算机视觉技术领域。该方法包括:获取视频库中各个视频的第一视频表征序列;分别对主体‑文本联合查询中的主体查询和文本查询进行表征提取,得到第一查询表征序列;对第一视频表征序列进行交互计算,得到融合了上下文语义的第二视频表征序列,以及,对第一查询表征序列进行交互计算,得到第二查询表征序列;根据第二查询表征序列中的语义表征和第二视频表征序列,计算主体‑文本联合查询与各个视频的相似度,并将最大相似度对应的视频作为检索视频;根据第二查询表征序列和检索视频对应的第二视频表征序列预测片段的起止时间戳,得到主体‑文本联合查询对应的检索视频片段。