摘要
本申请公开了一种自动驾驶道路图像标注方法、设备及介质,涉及计算机视觉领域,方法包括:采集车辆自动驾驶过程中的道路场景图像,提取道路场景图像的多尺度视觉特征,通过预标注训练集判断是否存在已知类别物体;若不存在,则识别多尺度视觉特征的密集区域,生成为新物体候选区域,生成对应的候选文本描述;基于候选文本描述,在语义文本库中进行匹配,确定相似度最高的相似语义文本;将相似语义文本和多尺度视觉特征进行融合,生成视觉特征图,确定初始物体标注框以及对应的视觉置信度得分;对初始物体标注框进行筛选,输出目标物体的标注框。将视觉特征与文本语义融合,显著提升了对动态道路场景中新兴物体的适配能力。