一种基于多模态视觉的无人机对地目标追踪方法及系统

申请号：CN202510056927

申请日期：2025-01-14

公开号：CN119963602A

公开日期：2025-05-09

类型：发明专利

摘要

本发明公开了一种基于多模态视觉的无人机对地目标追踪方法及系统，首先利用多模态传感器在无人机上采集目标多模态图像并获得采集图像数据，再对采集图像数据进行图像预处理并获得预处理后图像数据，接着构建基于Transformer架构并集成模态交互机制的深度学习模型；本发明实现了具有采用无人机搭载RGB和红外相机的方式获取目标的多模态图像数据从而应对复杂场景中的低光照和遮挡的功能，且采用基于Transformer架构的深度学习模型能提取双模态特征，而通过多头自注意力机制进行特征融合能增强目标识别能力，同时图像追踪模型在部署到无人机上后能实现每秒超过30帧的实时追踪并自动生成目标追踪报告，提高了无人机目标追踪稳定性，适合被广泛推广和使用。

技术关键词

深度学习模型无人机追踪方法多模态传感器特征融合网络交互机制模板特征双模态多头注意力机制搜索特征图像采集模块视觉数据追踪系统红外相机云端

系统为您推荐了相关专利信息

一种黑盒对抗样本生成方法及装置

识别标签 PID控制参数 PID控制器深度神经网络样本生成方法

一种非线性对抗策略优化方法

策略优化方法障碍物图像非线性加速度

一种露采机自动纠偏方法、系统及存储介质

纠偏方法轨迹实时位置多视影像密集匹配开采程序

一种多模态农业数据协同处理系统、方法、处理设备及存储介质

多模态执行设备无人机影像数据人工智能模型农业数据采集

一种缩短语义解码延迟的英语听力口语深度训练系统

训练系统语音输入模块声学特征重构模块解码