一种基于编码器-解码器架构的自适应图像深度估计方法
申请号:CN202510424769
申请日期:2025-04-07
公开号:CN120563586A
公开日期:2025-08-29
类型:发明专利
摘要
一种基于编码器‑解码器架构的自适应图像深度估计方法,将深度估计任务转化为分类问题,通过将深度范围划分为固定数量、宽度相等的区间进行处理,通过预训练的DenseNet编码器对图像进行编码,再将编码结果输入标准特征上采样解码器进行解码,从而输出解码特征张量再将解码特征张量输入Mini‑ViT模型进行处理,得到每个像素位置的深度预测值通过深度预测值及真实深度值di计算图像的总损失,进而调整模型参数,进行模型训练。本发明不仅可以通过对图像进行编解码处理得到解码特征张量,有效提高图像深度估计的准确度,而且可以通过Mini‑ViT模型实现最高分辨率的图像的深度估计。
技术关键词
图像深度估计方法
解码器架构
编码器
前馈神经网络
计算机程序代码
注意力
图像深度估计系统
像素
编解码
模型训练模块
计算机可存储介质
上采样
深度值
处理器
计算机程序产品