AI资讯新闻榜单内容搜索-扩散模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 扩散模型
图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

自回归(AR)范式凭借将语言转化为离散 token 的核心技术,在大语言模型领域大获成功 —— 从 GPT-3 到 GPT-4o,「next-token prediction」以简单粗暴的因果建模横扫语言领域。

来自主题: AI技术研报
7056 点击    2025-05-18 14:28
一键开关灯!谷歌用扩散模型,将电影级光影控制玩到极致

一键开关灯!谷歌用扩散模型,将电影级光影控制玩到极致

一键开关灯!谷歌用扩散模型,将电影级光影控制玩到极致

最近,Google 推出了一个可以精准控制画面中光影的项目 —— LightLab。 它让用户能够从单张图像实现对光源的细粒度参数化控制, 可以改变可见光源的强度和颜色、环境光的强度,并且能够将虚拟光源插入场景中。

来自主题: AI技术研报
7759 点击    2025-05-16 15:14
ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM

ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM

ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM

扩散模型(Diffusion Models)近年来在生成任务上取得了突破性的进展,不仅在图像生成、视频合成、语音合成等领域都实现了卓越表现,推动了文本到图像、视频生成的技术革新。然而,标准扩散模型的设计通常只适用于从随机噪声生成数据的任务,对于图像翻译或图像修复这类明确给定输入和输出之间映射关系的任务并不适合。

来自主题: AI技术研报
6958 点击    2025-05-08 14:23
ICML 2025 | 视频生成模型无损加速两倍,秘诀竟然是「抓住attention的时空稀疏性」

ICML 2025 | 视频生成模型无损加速两倍,秘诀竟然是「抓住attention的时空稀疏性」

ICML 2025 | 视频生成模型无损加速两倍,秘诀竟然是「抓住attention的时空稀疏性」

自 OpenAI 发布 Sora 以来,AI 视频生成技术进入快速爆发阶段。凭借扩散模型强大的生成能力,我们已经可以看到接近现实的视频生成效果。但在模型逼真度不断提升的同时,速度瓶颈却成为横亘在大规模应用道路上的最大障碍。

来自主题: AI技术研报
7918 点击    2025-05-08 10:15
CVPR 2025 | 如何稳定且高效地生成个性化的多人图像?ID-Patch带来新解法

CVPR 2025 | 如何稳定且高效地生成个性化的多人图像?ID-Patch带来新解法

CVPR 2025 | 如何稳定且高效地生成个性化的多人图像?ID-Patch带来新解法

扩散模型(Diffusion Models, DMs)如今已成为文本生成图像的核心引擎。凭借惊艳的图像生成能力,它们正悄然改变着艺术创作、广告设计、乃至社交媒体内容的生产方式。

来自主题: AI技术研报
6290 点击    2025-05-03 14:52
北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

最近,北京大学陈宝权教授带领团队在三维形状生成和三维数据对齐方面取得新的突破。在三维数据生成方面,团队提出了3D自回归模型新范式,有望打破3D扩散模型在三维生成方面的垄断地位。

来自主题: AI技术研报
7855 点击    2025-04-25 10:08
喝点VC|a16z重磅预测:AI虚拟人将孕育众多市值达数十亿美元的行业巨头

喝点VC|a16z重磅预测:AI虚拟人将孕育众多市值达数十亿美元的行业巨头

喝点VC|a16z重磅预测:AI虚拟人将孕育众多市值达数十亿美元的行业巨头

AI虚拟人模型架构从CNN、GANs演进至Transformer+扩散模型,实现从单一面部驱动到半身/全身动态生成的跨越,口型同步与多模态协同表现显著提升。

来自主题: AI资讯
6987 点击    2025-04-23 15:17
纯自回归图像生成模型开源来了,复旦联手字节seed共同捍卫自回归

纯自回归图像生成模型开源来了,复旦联手字节seed共同捍卫自回归

纯自回归图像生成模型开源来了,复旦联手字节seed共同捍卫自回归

基于Transformer的自回归架构在语言建模上取得了显著成功,但在图像生成领域,扩散模型凭借强大的生成质量和可控性占据了主导地位。

来自主题: AI技术研报
7249 点击    2025-04-19 15:01