主体-文本联合查询的视频库片段检索方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
主体-文本联合查询的视频库片段检索方法和装置
申请号:CN202510263770
申请日期:2025-03-06
公开号:CN120086410A
公开日期:2025-06-03
类型:发明专利
摘要
本申请提供了一种主体‑文本联合查询的视频库片段检索方法和装置,涉及计算机视觉技术领域。该方法包括:获取视频库中各个视频的第一视频表征序列;分别对主体‑文本联合查询中的主体查询和文本查询进行表征提取,得到第一查询表征序列;对第一视频表征序列进行交互计算,得到融合了上下文语义的第二视频表征序列,以及,对第一查询表征序列进行交互计算,得到第二查询表征序列;根据第二查询表征序列中的语义表征和第二视频表征序列,计算主体‑文本联合查询与各个视频的相似度,并将最大相似度对应的视频作为检索视频;根据第二查询表征序列和检索视频对应的第二视频表征序列预测片段的起止时间戳,得到主体‑文本联合查询对应的检索视频片段。
技术关键词
序列 人脸表征 文本 语义 视频库 图像 检索方法 计算机视觉技术 模型底部 检索装置 模块 样本