AI资讯新闻榜单内容搜索-扩散模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 扩散模型
CVPR 24|ETH Zurich等团队:重新定义小样本3D分割任务,新基准开启广阔提升潜力!

CVPR 24|ETH Zurich等团队:重新定义小样本3D分割任务,新基准开启广阔提升潜力!

CVPR 24|ETH Zurich等团队:重新定义小样本3D分割任务,新基准开启广阔提升潜力!

3D场景理解让人形机器人「看得见」周身场景,使汽车自动驾驶功能能够实时感知行驶过程中可能出现的情形,从而做出更加智能化的行为和反应。而这一切需要大量3D场景的详细标注,从而急剧提升时间成本和资源投入。

来自主题: AI技术研报
8631 点击    2024-06-23 19:44
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

在生成式模型的迅速发展中,Image Tokenization 扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latent space),使得生成高分辨率图像更有效率。

来自主题: AI技术研报
10717 点击    2024-06-22 23:00
高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF

高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF

高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF

在三维生成建模的研究领域,现行的两大类 3D 表示方法要么基于拟合能力不足的隐式解码器,要么缺乏清晰定义的空间结构难以与主流的 3D 扩散技术融合。来自中科大、清华和微软亚洲研究院的研究人员提出了 GaussianCube,这是一种具有强大拟合能力的显式结构化三维表示,并且可以无缝应用于目前主流的 3D 扩散模型中。

来自主题: AI技术研报
10403 点击    2024-06-16 18:15
SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片

SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片

SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片

3D生成是生成式人工智能和计算机图形学领域最引人注目的话题之一,符合影视、游戏标准的3D生成尤其受产业界关注。在生产流程中,一般品类的3D资产往往通过手工建模或者扫描的方式制作。但作为3D资产的一个重要类别,服装资产的往往来源于平面板片与物理模拟等流程,而不是直接在3D上建模。

来自主题: AI技术研报
7496 点击    2024-06-15 15:44
Stable Diffusion 3开源秒翻车,画人好掉san

Stable Diffusion 3开源秒翻车,画人好掉san

Stable Diffusion 3开源秒翻车,画人好掉san

没想到……Stable Diffusion 3开源即出现翻车案例。 生成一个躺在草地上的女孩,结果长这样?

来自主题: AI资讯
7039 点击    2024-06-13 21:16
CVPR 2024|让图像扩散模型生成高质量360度场景,只需要一个语言模型

CVPR 2024|让图像扩散模型生成高质量360度场景,只需要一个语言模型

CVPR 2024|让图像扩散模型生成高质量360度场景,只需要一个语言模型

360 度场景生成是计算机视觉的重要任务,主流方法主要可分为两类,一类利用图像扩散模型分别生成 360 度场景的多个视角。由于图像扩散模型缺乏场景全局结构的先验知识,这类方法无法有效生成多样的 360 度视角,导致场景内主要的目标被多次重复生成,如图 1 的床和雕塑。

来自主题: AI技术研报
9368 点击    2024-06-11 10:02