基于像素空间扩散生成的无飞点单目深度估计方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于像素空间扩散生成的无飞点单目深度估计方法和装置
申请号:CN202511026113
申请日期:2025-07-24
公开号:CN120976281A
公开日期:2025-11-18
类型:发明专利
摘要
本发明涉及计算机视觉深度估计技术领域,特别是涉及一种基于像素空间扩散生成的无飞点单目深度估计方法和装置,本发明通过视觉基础模型提取出输入图像中的高级语义表示,并通过语义引导DiT块接收所述高级语义表示作为引导信号,增强了全局图像结构和细粒度细节的建模,同时保留了DiT块的简单性和可扩展性;语义引导DiT块有效地模拟了全局图像结构和细粒度细节,从而显著提高了深度预测的准确性;通过集成高级语义表示,直接在像素空间而不是潜在空间中执行扩散的深度预测,允许直接模拟深度的像素分布,而不是通过VAE将深度图压缩到潜在空间中再进行深度估计,从而避免了飞点对深度估计图的影响。
技术关键词
单目深度估计方法 语义 噪声样本 像素 深度预测模型 计算机可执行指令 微分方程求解器 多层感知器网络 图像结构 深度估计技术 图像投影 边缘检测算子 计算机存储介质 双线性插值 生成噪声 点云 视觉
系统为您推荐了相关专利信息
浅层神经网络 文本 跨模态 语义标签 多模态
无人机集群 辅助无线通信 决策 笛卡尔坐标系 邻居
国际运价数据 智能解析方法 搜索工具 解析器 语义
模糊隶属度 液体火箭发动机 信息转换方法 隶属度函数 模糊语义
半导体芯片表面 缺陷检测方法 神经网络模型 表面缺陷检测 分析表面缺陷