一种基于多模态数据分析的无人机巡检方法、设备及介质
申请号:CN202411033340
申请日期:2024-07-30
公开号:CN119048951A
公开日期:2024-11-29
类型:发明专利
摘要
本发明公开了一种基于多模态数据分析的无人机巡检方法、设备及介质。方法包括以下步骤:通过无人机采集目标对象的音频数据和视频数据;对音频数据和视频数据进行预处理;将所述音频数据和视频数据融合,生成特征序列数据集;将所述特征序列数据集输入多模态检测模型,得到目标对象的行为检测结果。本发明实施例采用了图像和语音两种多模态数据输入来构建检测模型,融合多种传感器数据,能够获取更丰富的行为信息和上下文环境信息,提高检测的深度和准确性。本发明实施例通过多模态融合进行行为分析,能够有效提高方法的鲁棒性和适应性,使得本发明方法能够适用于各种场景,满足多样化的行为检测需求。
技术关键词
多模态数据分析
无人机巡检方法
音频特征
序列
交叉注意力机制
梅尔频率倒谱系数
生成特征
上下文环境信息
视频帧
生成视频数据
组合模块
对象
卷积特征提取
离散余弦变换