从无相机位姿的图像实现同步三维重建与场景理解的方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
从无相机位姿的图像实现同步三维重建与场景理解的方法及装置
申请号:CN202510910221
申请日期:2025-07-02
公开号:CN120807789A
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开一种从无相机位姿的图像实现同步三维重建与场景理解的方法及装置,该方法通过给定一组稀疏的无相机位姿的多视角图像及其对应的相机内参,构建并训练同步三维重建与场景理解模型,该模型包括图像编码器、高斯解码器、统一查询解码器、几何引导的多视角掩码聚合模块、二维到三维语义映射模块;并利用训练后的同步三维重建与场景理解模型输出的辐射场进行在线的同步三维重建与场景理解。本发明无需特征对齐的范式和统一的任务建模,能够支持三维场景重建、三维语义/实例/全景/文本引用的场景理解等多重下游任务,且采用本发明进行三维场景重建的视觉质量高,三维场景理解更精确。
技术关键词
场景 图像编码器 多视角 相机 文本编码器 解码器 语义特征 实例分割 像素 参数 模块 索引 可读存储介质 变换器 视觉 在线
系统为您推荐了相关专利信息
训练测试方法 场景类别 算法 实车测试方法 交通流
题目生成方法 预训练语言模型 数据 训练集 电子设备
综合管理系统 算法架构 算法引擎 算法模型 智能框架
密码检测方法 多模态特征融合 文本 字典 字符
智能监测装置 果蔬类 气体检测模块 传感模块 模数转换模块