基于深度神经网络模型及多示例学习的视频检索方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于深度神经网络模型及多示例学习的视频检索方法
申请号:CN202411831100
申请日期:2024-12-12
公开号:CN119862305B
公开日期:2025-10-10
类型:发明专利
摘要
本发明涉及计算机视觉处理领域,具体的说是一种基于深度神经网络模型及多示例学习的视频检索方法,包括,对查询文本预训练得到初始特征,对视频提取I 3D‑RGB特征及ROI特征及连接特征;更新得到帧级视觉特征及字级文本特征;构造训练用图,图注意力网络学习得到词级文本特征;计算词级文本和字级文本特征残差,残差均值为句子级文本特征;对帧级视觉特征进行段维度平均运算得到管道级视觉特征;计算句子级文本特征、管道级视觉特征的对齐分数,构建正样本对和负样本对,训练视频检索网络;本发明通过深度学习特征获取多查询文本中的鉴别力特征来构造图神经网络,以在弱监督设定下提供更具有表征含义的文本特征及多模态对齐监督信号。
技术关键词
视频检索方法 深度神经网络模型 视觉特征 文本 RGB特征 定义 排序损失 管道 Softmax函数 顶点 样本 深度学习特征 注意力 节点特征 ReLU函数 前馈神经网络 视频帧 梯度下降法
系统为您推荐了相关专利信息
金融业务信息 车辆识别模型 风险评估模型 视觉特征 图像
文本还原方法 还原装置 数据 图片 视频录制设备
文本 动态 视觉 多模态 融合策略
框架方法 人机协同 大语言模型 动态 语义
数据脱敏方法 计算机执行指令 深度神经网络模型 策略 数据脱敏装置