AI资讯新闻榜单内容搜索-扩散模型

字节豆包全新图像Tokenizer：生成图像最低只需32个token，最高提速410倍

在生成式模型的迅速发展中，Image Tokenization 扮演着一个很重要的角色，例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间（latent space），使得生成高分辨率图像更有效率。

来自主题: AI技术研报

12339 点击 2024-06-22 23:00

无论真实还是AI视频，「摩斯卡」都能重建恢复4D动态可渲染场景

从任意单目视频重建可渲染的动态场景是计算机视觉研究领域的一个圣杯。

来自主题: AI技术研报

10869 点击 2024-06-21 19:54

CVPR 2024 Highlight | 北航等发布「时间特征维护」：无需训练，极致压缩加速Diffusion

拯救4bit扩散模型精度，仅需时间特征维护——以超低精度量化技术重塑图像内容生成！

来自主题: AI技术研报

11360 点击 2024-06-20 11:26

谢赛宁对话Sora 负责人：AI 视觉的基础是对压缩图像的学习

语言将是获得更智能系统的重要组成部分。

来自主题: AI资讯

10240 点击 2024-06-17 19:20

高质量3D生成最有希望的一集？GaussianCube在三维生成中全面超越NeRF

在三维生成建模的研究领域，现行的两大类 3D 表示方法要么基于拟合能力不足的隐式解码器，要么缺乏清晰定义的空间结构难以与主流的 3D 扩散技术融合。来自中科大、清华和微软亚洲研究院的研究人员提出了 GaussianCube，这是一种具有强大拟合能力的显式结构化三维表示，并且可以无缝应用于目前主流的 3D 扩散模型中。

来自主题: AI技术研报

11711 点击 2024-06-16 18:15