一种车辆自动驾驶视听觉信息融合方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种车辆自动驾驶视听觉信息融合方法及装置
申请号:CN202510612651
申请日期:2025-05-13
公开号:CN120123996B
公开日期:2025-07-04
类型:发明专利
摘要
本发明公开一种车辆自动驾驶视听觉信息融合方法及装置,包括:获取车辆采集的视觉信息以及听觉信息;听觉信息包括声源方向;将听觉信息投影到视觉信息的坐标系中;通过注意力机制将在同一坐标系中的视觉信息与听觉信息融合,得到融合特征;将听觉信息投影到视觉信息的视觉坐标系中包括:获取车辆摄像头的内参矩阵;根据声源方向得到车辆摄像头到声源的距离值;根据内参矩阵以及距离值将声源方向转化为视觉坐标系下的坐标。通过获取车辆的视觉信息以及听觉信息后,将听觉信息投影到视觉信息的坐标系中,使得听觉信息和视觉信息能够在同一坐标系下进行有效地融合,从而通过融合特征进行目标检测和定位提高车辆对复杂场景的感知精度和鲁棒性。
技术关键词
视听觉信息 融合方法 坐标系 贝叶斯决策理论 车辆 融合特征 注意力机制 麦克风阵列采集 矩阵 深度学习模型 融合装置 视觉特征 处理器 存储器 鲁棒性 信号