一种多模态数据融合的实时语义分割与目标检测联合模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多模态数据融合的实时语义分割与目标检测联合模型
申请号:CN202510686329
申请日期:2025-05-27
公开号:CN120635406A
公开日期:2025-09-12
类型:发明专利
摘要
本发明涉及多模态计算机视觉领域,具体为一种多模态数据融合的实时语义分割与目标检测联合模型。该模型通过以下技术手段实现:基于RGB图像、深度信息及激光雷达数据,设计多分支网络分别提取不同模态特征;引入动态模态选择模块,根据环境条件自动选择最优的模态组合,提升模型在复杂场景下的自适应能力;利用UAFM特征融合模块实现跨模态信息互补;通过逐级解码结构,逐步融合多尺度特征以平衡细节与全局语义信息;采用联合训练机制,同步输出语义分割结果和目标检测框,减少计算冗余。本发明在多模态数据支持下显著提升复杂场景下的分割与检测精度;通过动态模态选择与特征共享,实现高效实时处理,推理速度较独立模型提升30%以上。
技术关键词
多模态数据融合 语义 互补特征 多任务损失函数 融合特征 多尺度信息 模态特征 注意力 特征提取模块 Softmax函数 融合多尺度特征 跨模态 多尺度特征融合 上采样 区域建议网络 解码模块 激光雷达点云 激光雷达数据 全局平均池化