一种基于编码器-解码器架构的自适应图像深度估计方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于编码器-解码器架构的自适应图像深度估计方法
申请号:CN202510424769
申请日期:2025-04-07
公开号:CN120563586A
公开日期:2025-08-29
类型:发明专利
摘要
一种基于编码器‑解码器架构的自适应图像深度估计方法,将深度估计任务转化为分类问题,通过将深度范围划分为固定数量、宽度相等的区间进行处理,通过预训练的DenseNet编码器对图像进行编码,再将编码结果输入标准特征上采样解码器进行解码,从而输出解码特征张量再将解码特征张量输入Mini‑ViT模型进行处理,得到每个像素位置的深度预测值通过深度预测值及真实深度值di计算图像的总损失,进而调整模型参数,进行模型训练。本发明不仅可以通过对图像进行编解码处理得到解码特征张量,有效提高图像深度估计的准确度,而且可以通过Mini‑ViT模型实现最高分辨率的图像的深度估计。
技术关键词
图像深度估计方法 解码器架构 编码器 前馈神经网络 计算机程序代码 注意力 图像深度估计系统 像素 编解码 模型训练模块 计算机可存储介质 上采样 深度值 处理器 计算机程序产品
系统为您推荐了相关专利信息
嵌入特征 图片 跟踪方法 融合特征 注意力
图像处理技术 柏林噪声 神经网络模型 大气散射模型 生成烟雾
宠物食品 传送单元 偏振光 多光谱 旋转编码器
分割算法 网络摄像机 数据 物体 图像编码器
标识匹配系统 标识匹配方法 语义 术语 序列