摘要
本发明涉及图像实时拼接技术领域,更具体地说,涉及基于深度学习的多镜头图像实时拼接优化方法,包括:获取多个镜头采集的图像数据;获取多个镜头的初始拍摄参数;基于图像数据,利用深度学习模型提取图像特征;根据图像特征,执行图像配准操作;基于配准结果,计算图像拼接权重;根据拼接权重,生成拼接图像;输出拼接图像;基于拼接图像的质量评估结果,更新拍摄参数,通过设计专门的深度学习模型,大幅提高了特征提取和匹配的准确性和鲁棒性。该模型能够适应各种复杂场景,如光照变化、纹理重复等,有效克服了传统方法在这些情况下的局限性。特别是在动态场景中,本发明的方法表现出了优异的适应能力,为实时视频拼接提供了可靠的技术支持。