一种基于视觉Transformer的动态筛选医疗图像目标跟踪方法、装置

申请号：CN202511335181

申请日期：2025-09-18

公开号：CN120823216B

公开日期：2025-11-21

类型：发明专利

摘要

本发明提供了一种基于视觉Transformer的动态筛选医疗图像目标跟踪方法、装置，涉及计算机视觉技术领域，该方法先将近红外或可见光眼底视频帧标准化为统一分辨率并构建模板—搜索帧对，随后将两帧图像联合映射为Token序列。整体网络在每个剪枝层前嵌入动态局部交互模块，利用深度可分离卷积和点卷积捕获局部上下文，并驱动动态卷积核生成器，自适应加权聚合邻域 Token。紧接着，Token 筛选与压缩机制 TSC 在同一剪枝层内运行，仅保留Top‑K关键 Token，冗余Token被剪除且原始索引被记录。旨在提升病灶区域（如视盘）在复杂手术视频中的定位稳定性和推理效率。

技术关键词

序列跟踪方法视盘模板视频网络眼底相机采集设备模块编码动态权重分配多头注意力机制计算机视觉技术邻域语义图像块