从无相机位姿的图像实现同步三维重建与场景理解的方法及装置

申请号：CN202510910221

申请日期：2025-07-02

公开号：CN120807789A

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开一种从无相机位姿的图像实现同步三维重建与场景理解的方法及装置，该方法通过给定一组稀疏的无相机位姿的多视角图像及其对应的相机内参，构建并训练同步三维重建与场景理解模型，该模型包括图像编码器、高斯解码器、统一查询解码器、几何引导的多视角掩码聚合模块、二维到三维语义映射模块；并利用训练后的同步三维重建与场景理解模型输出的辐射场进行在线的同步三维重建与场景理解。本发明无需特征对齐的范式和统一的任务建模，能够支持三维场景重建、三维语义/实例/全景/文本引用的场景理解等多重下游任务，且采用本发明进行三维场景重建的视觉质量高，三维场景理解更精确。

技术关键词

场景图像编码器多视角相机文本编码器解码器语义特征实例分割像素参数模块索引可读存储介质变换器视觉在线

系统为您推荐了相关专利信息

一种面向自动驾驶算法的一体化训练测试方法

训练测试方法场景类别算法实车测试方法交通流

面试题目生成方法、装置、电子设备及存储介质

题目生成方法预训练语言模型数据训练集电子设备

一种用于智能化教务数据的一站式综合管理系统

综合管理系统算法架构算法引擎算法模型智能框架

基于多模态特征融合与动态行为分析的弱密码检测方法

密码检测方法多模态特征融合文本字典字符

一种基于多模态感知融合的果蔬类腐坏智能监测装置及其方法

智能监测装置果蔬类气体检测模块传感模块模数转换模块