一种基于高阶特征和注意力机制的多模态单目深度估计方法
申请号:CN202411512404
申请日期:2024-10-28
公开号:CN119515944A
公开日期:2025-02-25
类型:发明专利
摘要
本发明公开了一种基于高阶特征和注意力机制的多模态单目深度估计方法,包括:获取单目RGB图和对应的真实深度图,并对训练集中的单目RGB图进行数据增强处理;构造基于高阶特征和注意力机制的多模态单目深度估计网络模型,构建多模态单目深度估计网络模型的损失函数,利用划分好的训练集训练所述多模态单目深度估计网络模型,在训练过程的反向传播中,其中梯度值通过链式法则传递,并采用优化算法更新该网络模型的参数,通过多次迭代训练,逐渐收敛控制损失函数在训练数据上的值最小,获得最佳权重;将测试集中的图像输入至具有最佳权重的多模态单目深度估计网络模型中,获得RGB单目图对应的预测深度图。
技术关键词
单目深度估计方法
注意力机制
深度图
文本编码器
图像编码器
多模态
解码器单元
网络
迭代方法
训练集
数据
标记器
双线性
深度值
计算方法