基于大模型的深度图生成方法、三维重建方法、装置、电子设备和存储介质

申请号：CN202510830781

申请日期：2025-06-19

公开号：CN120672926A

公开日期：2025-09-19

类型：发明专利

摘要

本公开提供了一种基于大模型的深度图生成方法、三维重建方法、装置、电子设备和存储介质，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于实时道路场景深度感知、环境三维重建与避障，以及虚实场景融合等场景下。具体实现方案为：对单目图像进行视觉编码，得到编码图像；将编码图像和目标文本输入预训练大语言模型进行融合，得到融合特征；基于融合特征生成全局引导特征，全局引导特征包括视觉特征和文本特征的联合语义信息；对单目图像的彩色图像添加噪声，得到噪声特征序列；以全局引导特征为条件，对噪声特征序列进行去噪，生成与联合语义信息匹配的隐式特征；基于隐式特征生成深度图。

技术关键词

噪声特征融合特征视觉特征文本图像采集设备三维重建方法彩色图像编码生成深度图大语言模型隐式特征序列深度图生成装置多尺度特征生成方法语义三维重建装置

系统为您推荐了相关专利信息

一种人工智能的心理疾病分诊方法及系统

分诊方法情绪特征生物标记物深度学习模型对象

一种基于大规模语言模型的数据分析方法

数据分析方法语句文本序列分词

勘探开发结构化数据查询与可视化方法、系统、介质及设备

可视化方法大语言模型语句图谱自然语言

一种元件零样本异常检测方法

异常检测方法文本编码器适配器图像嵌入语义

基于超分辨率视觉的整包即开型彩票自动分拣复核方法及系统

彩票光谱响应特征视觉特征覆膜融合特征