多模态融合的3D目标检测方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模态融合的3D目标检测方法、装置、设备及存储介质
申请号:CN202511369811
申请日期:2025-09-24
公开号:CN121033809A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开一种多模态融合的3D目标检测方法、装置、设备及存储介质,包括:采集当前帧的图像数据和点云数据;将历史帧的目标查询向量和可学习的全局查询向量通过自注意力机制进行融合,作为当前帧的目标查询向量;针对图像和点云的不同特性,采取不同的融合方式,获取所要融合的图像特征和点云特征;将所要融合的图像特征和所要融合的点云特征进行拼接,并输入前馈神经网络,得到更新后的当前帧的目标查询向量;基于更新后的当前帧的目标查询向量进行检测,获得当前帧的3D检测结果。本发明能够有效提升检测性能、优化效率与鲁棒性、增强跟踪与泛化能力。
技术关键词
多头注意力机制 三维场景空间 前馈神经网络 神经网络训练 图像处理 多模态 特征提取模块 分支 数据 点云特征提取 动态更新 图像特征提取 坐标 编码 程序 拼接模块