AI资讯新闻榜单内容搜索-3D

北大团队让AI学会考古！全球首个古希腊陶罐3D视觉问答数据集发布，还配了专用模型

现在AI都懂文物懂历史了。一项来自北京大学的最新研究引发关注：他们推出了全球首个面向古希腊陶罐的3D视觉问答数据集——VaseVQA-3D，并配套推出了专用视觉语言模型VaseVLM。这意味着，AI正在从“识图机器”迈向“文化考古Agent”。

来自主题: AI技术研报

9015 点击 2025-11-07 14:49

Feed-Forward 3D综述：三维视觉如何「一步到位」

在 3D 视觉领域，如何从二维图像快速、精准地恢复三维世界，一直是计算机视觉与计算机图形学最核心的问题之一。从早期的 Structure-from-Motion (SfM) 到 Neural Radiance Fields (NeRF)，再到 3D Gaussian Splatting (3DGS)，技术的演进让我们离实时、通用的 3D 理解越来越近。

来自主题: AI技术研报

7405 点击 2025-11-07 10:15

少量视角也能得到完整3D几何，即插即用的语义增强重建插件来了

直观经验却告诉我们，只要把同一物体的 “对应部分” 对齐，形状就会变得清晰。基于这一朴素而有效的直觉，作者提出SERES（Semantic-Aware Reconstruction from Sparse Views），在不改动主干框架的前提下，把跨视角的语义一致性变成一种训练期先验注入到模型里，用低成本的方法去解决高价值的歧义问题，让少量视角也能得到清晰而完整的几何。

来自主题: AI技术研报

7630 点击 2025-11-02 10:03

首个实例理解3D重建模型！NTU&阶越提出基于实例解耦的3D重建模型，助理场景理解

现在，NTU联合StepFun提出了IGGT (Instance-Grounded Geometry Transformer) ，一个创新的端到端大型统一Transformer，首次将空间重建与实例级上下文理解融为一体。

来自主题: AI技术研报

6808 点击 2025-10-31 14:49

世界模型可单GPU秒级生成了？厦大、腾讯开源FlashWorld，效果惊艳、免费体验

厦门大学和腾讯合作的最新论文《FlashWorld: High-quality 3D Scene Generation within Seconds》获得了海内外的广泛关注，在当日 Huggingface Daily Paper 榜单位列第一，并在 X 上获得 AK、Midjourney 创始人、SuperSplat 创始人等 AI 大佬点赞转发。

来自主题: AI技术研报

7624 点击 2025-10-31 10:27

超94%类别第一！3D点云异常检测与修复新SOTA | ICCV'25

3D点云异常检测对制造、打印等领域至关重要，可传统方法常丢细节、难修复。上海科大与密歇根大学携手打造PASDF框架，借助「姿态对齐+连续表征」技术，达成检测修复一体化，实验显示其精准又稳定。

来自主题: AI技术研报

7865 点击 2025-10-28 09:34

一个指令误导智能模型！北航等首创3D语义攻击框架，成功率暴涨119%

人工智能模型的安全对齐问题，一直像悬在头顶的达摩克利斯之剑。自对抗样本被发现以来，这一安全对齐缺陷，广泛、长期地存在与不同的深度学习模型中。

来自主题: AI资讯

8088 点击 2025-10-23 16:00

SIGGRAPH Asia 2025 | OmniPart框架，让3D内容创作像拼搭积木一样简单

在3D内容创作领域，如何像玩乐高一样，自由生成、编辑和组合对象的各个部件，一直是一个核心挑战。香港大学、VAST、哈尔滨工业大学及浙江大学的研究者们联手，推出了一个名为 OmniPart 的全新框架，巧妙地解决了这一难题。该研究已被计算机图形学顶会 SIGGRAPH Asia 2025 接收。

来自主题: AI技术研报

7267 点击 2025-10-22 14:48

一张照片，一个3D「你」：计算所等提出HumanLift，实现高保真数字人重建

创建具有高度真实感的三维数字人，在三维影视制作、游戏开发以及虚拟/增强现实（VR/AR）等多个领域均有着广泛且重要的应用。

来自主题: AI技术研报

10319 点击 2025-10-22 12:07

Z Potentials｜专访胡渊鸣，清华姚班 × MIT博士，打造500万+用户的3D AI平台Meshy，一年营收增长18x

生成式 AI 正在重写 3D 内容的生产流程：从“DCC 工具 + 外包”的线性供给，演进到“资产规模化生成 + 管线可用”的指数供给模式。过去五年，技术范式经历了从实时体积渲染，NeRF，到Score Distillation，3D扩散的快速迭代；需求侧则由游戏与影视，向3D 打印、电商样机、数字人、教育培训、以及AR/VR等长尾场景外溢。

来自主题: AI资讯

10248 点击 2025-10-21 16:30