基于时空融合的多模态存量视频高效检索方法与装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于时空融合的多模态存量视频高效检索方法与装置
申请号:CN202411684267
申请日期:2024-11-22
公开号:CN119884412A
公开日期:2025-04-25
类型:发明专利
摘要
本发明提供一种基于时空融合的多模态存量视频高效检索方法与装置,包括:计算待检索视频的帧间相似度,并基于帧间相似度删除待检索视频的冗余帧,得到目标待检索视频;基于查询文本对目标待检索视频进行筛选处理,得到多个目标待检索视频片段;对查询文本和多个目标待检索视频片段分别进行特征提取处理,得到文本特征和多个视频特征;调用基于多模态融合的视频片段检索模型基于文本特征和多个视频特征进行模态交互预测,得到预测结果,并基于预测结果确定多个目标待检索视频片段中与查询文本对应的目标视频片段,通过删除冗余帧以及层级化目标视频片段搜索,实现从海量视频中快速筛选出目标视频片段,有效提升了视频筛选的效率。
技术关键词
视频 检索方法 文本 录像设备 多模态 融合特征 非暂态计算机可读存储介质 关键帧 冗余 软件开发工具包 处理器 特征提取模块 检索装置 关键词 计算机程序产品 匹配模块 存储器 电子设备 图像
系统为您推荐了相关专利信息
患者随访系统 医学影像检查报告 深度学习模型 PACS系统 电子病历系统
网络构建方法 命名实体识别技术 预训练语言模型 专业数据库 网络构建系统
频域特征 振动特征 时域特征 信号 预警机制
在线观测系统 聊天机器人 观测设备 数据分析模块 观测方法
显示设备 网络 图片显示方法 数据 控制器