利用文本和2D边界框同时生成多个3D物体的方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
利用文本和2D边界框同时生成多个3D物体的方法及系统
申请号:CN202411037901
申请日期:2024-07-31
公开号:CN119006759B
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开一种利用文本和2D边界框同时生成多个3D物体的方法及系统,包括3D内容增强模块、布局控制模块、多视图一致性控制模块以及布局和多视图知识整合模块。其中3D内容增强模块用于提升生成的3D内容的质量,布局控制模块用于控制同时生成的多个3D物体之间的位置,多视图一致性控制模块用于维持生成的多个物体的多视图一致性,布局和多视图知识整合模块用于统一蒸馏的多种知识并进一步增强生成物体的质量。本发明不需要改变预训练模型的结构和参数,同时解决了现有方法中存在的无法理解输入文本中复杂逻辑关系,只能生成单个物体的问题。
技术关键词
布局 物体 文本 控制模块 蒸馏 图片 噪声 多层感知机 预训练模型 视角 可读存储介质 编码 矩阵 误差 计算机 处理器 参数