摘要
本发明公开了计算机视觉领域的一种面向目标检测的图片合成方法,首先人工制作检测模型训练集,训练得到初步的检测模型,并使用SAM分割模型根据标注的检测坐标框获得物体前景作为合成物体;接着拿已训练的检测模型对真实场景的视频进行每一帧的检测,保存每一帧的检测信息,包括物体类别、物体尺寸和物体位置信息,并通过这些信息制作底图;最后遍历已保存的每一帧视频的检测信息,根据尺寸信息或中心距离信息选择同类别的前景,将前景融合到检测物体的中心位置。本发明方法保证合成物体在底图上的物体尺寸、位置和类别符合实际场景情况,并且可自动生成合成图片的标注,无需后续人为标注,合成的图片数据可有效地提高检测模型的性能。