AI资讯新闻榜单内容搜索-扩散模型

视频生成太慢？英伟达、谢赛宁等发布TMD框架，实现70倍加速

近年来，大规模视频扩散模型在视频生成领域取得了显著进展。然而，采样效率低下仍然是这类模型的核心瓶颈。

来自主题: AI技术研报

8763 点击 2026-03-11 15:05

扩散模型终于学会「看题下菜碟」！根据提示词难度动态分配算力，简单题省时复杂题保画质

扩散模型终于学会“看题下菜碟”了！

来自主题: AI技术研报

7861 点击 2026-03-11 09:24

可微奖励就该直接微调！用HJB方程颠覆流匹配对齐｜NeurIPS'25

用强化学习微调扩散模型，还有更好的办法吗？

来自主题: AI技术研报

7400 点击 2026-03-11 09:23

从训练到推理的「瘦身」演进：首篇高效扩散语言模型（dLLM）深度综述

在生成式 AI 的浪潮中，自回归（Autoregressive, AR）模型凭借其卓越的性能占据了统治地位。然而，其「从左到右」逐个预测 Token 的串行机制，天生限制了并行生成的可能性。

来自主题: AI技术研报

6204 点击 2026-03-10 14:29

ICLR2026 Oral | 北大彭一杰团队提出高效优化新范式，递归似然比梯度优化器赋能扩散模型后训练

在 AI 视觉生成领域，扩散模型（DM）凭借其强大的高保真数据生成能力，已成为图像合成、视频生成等多模态任务的核心框架。然而，预训练后的扩散模型如何高效适配下游应用需求，一直是行业面临的关键挑战。

来自主题: AI技术研报

7523 点击 2026-03-10 09:30

反直觉！扩散模型「跨界」复原: 只用卧室模型，竟能复原人脸

自扩散模型提出以来，它不仅在图像、视频和音频生成方面取得了优异效果，也正逐渐成为解决图像复原、超分辨率、去模糊等逆问题的重要工具。

来自主题: AI技术研报

9430 点击 2026-03-10 09:29

让搜索Agent不「傻等」：人大团队依托扩散模型实现「一心二用」，边等搜索结果边思考，加速15%性能不减

中国人民大学团队在论文DLLM-Searcher中，第一次让扩散大语言模型（dLLM）学会了这种“一心二用”的本事。目前主流的搜索Agent，不管是Search-R1还是R1Searcher，用的都是ReAct框架。这个框架的执行流程是严格串行的：

来自主题: AI技术研报

7884 点击 2026-03-02 10:00

ICLR 2026 | 把视频扩散模型压到4bit，还能接近满血效果？ QVGen让「超低比特视频生成量化」真正可用

香港科技大学 & 北航 & 商汤等提出了一个专门面向视频生成扩散模型的 QAT 范式 ——QVGen，在 3-bit / 4-bit 都能把质量拉回来，并且让 4-bit 首次接近全精度表现成为现实。该论文现已被 ICLR 高分接收：rebuttal 前 88666（top 1.4%），rebuttal 后 88886 （top 0.5%）。

来自主题: AI技术研报

8210 点击 2026-02-28 15:12

扩散模型成最快深度思考！告别自回归每秒1009个tokens，英伟达微软都投了

前面已经说了，传统自回归就像打字机一样，一次只能处理一个token，且必须按照从左到右的顺序。但扩散模型Mercury 2的工作方式更像一位编辑——最终，Mercury 2能将生成速度提升5倍以上，且速度曲线截然不同。

来自主题: AI资讯

9652 点击 2026-02-26 12:26

又快又省？仅5%参数、训练快4倍！ArcFlow用「非线性」魔法实现FLUX/Qwen推理40倍加速

复旦大学与微软亚洲研究院带来的 ArcFlow 给出了答案：如果路是弯的，那就学会 “漂移”，而不是把路修直。在扩散模型中，教师模型（Pre-trained Teacher）的生成过程本质上是在高维空间中求解微分方程并进行多步积分。由于图像流形的复杂性，教师模型原本的采样轨迹通常是一条蜿蜒的曲线，其切线方向（即速度场）随时间步不断变化。

来自主题: AI技术研报

7934 点击 2026-02-25 14:15