自适应视觉-语言匹配检测与跟踪方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
自适应视觉-语言匹配检测与跟踪方法
申请号:CN202511047813
申请日期:2025-07-29
公开号:CN120563868B
公开日期:2025-09-23
类型:发明专利
摘要
本发明属于计算机视觉、视觉‑语言匹配检测、多模态目标跟踪领域,公开了一种自适应视觉‑语言匹配检测与跟踪方法。首先利用预训练多模态大模型的模态对齐与表征优势,构建视觉‑语言多模态跟踪大模型;并提出视觉上下文感知提示学习算法,从当前搜索特征中提取视觉上下文特征,采用提示学习将其融入文本编码过程,实现文本特征对视觉变化的动态感知;此外,设计语言自适应隐式更新机制,通过在文本编码过程中嵌入可学习向量,并结合动态的视觉上下文线索,实现在跟踪过程中对文本特征的隐式更新,使静态语言能够动态匹配视觉外观,从而提升视觉‑语言检测跟踪性能。
技术关键词
文本编码器 搜索特征 图像编码器 上下文特征 多模态 模板特征 跟踪方法 提示器 分支 分词 模块 参数 计算机视觉 注意力 学习算法
系统为您推荐了相关专利信息
遥感图像分割方法 跨模态 图像编码器 语言编码器 图像解码器
可见光图像 融合方法 深度卷积网络 语义分割神经网络 热力图
多平台交互 元素推荐方法 互联网大数据 兴趣 画像
处理单元 变电站SF6气体 云端 传输单元 展示单元
回折线圈 缺陷检测装置 缺陷检测方法 多模态 双频接收