AI资讯新闻榜单内容搜索-训练

Stable-DiffCoder超越自回归模型！扩散模型在代码生成取得新突破

扩散语言模型（Diffusion Language Models, DLLMs）因其多种潜在的特性而备受关注，如能加速的非自回归并行生成特性，能直接起草编辑的特性，能数据增强的特性。然而，其模型能力往往落后于同等规模的强力自回归（AR）模型。

来自主题: AI技术研报

10679 点击 2026-02-06 10:37

在大模型时代，从代码生成到数学推理，再到自主规划的 Agent 系统，强化学习几乎成了「最后一公里」的标准配置。

来自主题: AI技术研报

7239 点击 2026-02-06 10:34

又一位大佬准备对现有 AI 技术范式开刀了。

来自主题: AI资讯

7731 点击 2026-02-05 13:54

近日，美团推出全新多模态统一大模型方案 STAR（STacked AutoRegressive Scheme for Unified Multimodal Learning），凭借创新的 "堆叠自回归架构 + 任务递进训练" 双核心设计，实现了 "理解能力不打折、生成能力达顶尖" 的双重突破。

来自主题: AI技术研报

10696 点击 2026-02-05 13:50

刚刚，谷歌发布了一项新的研究进展：他们用 Gemini 做了一次系统性的数学攻关实验，把目标对准了著名的 Erdős Problems 数据库里 700 个仍被标注为 open（未解决）的猜想。

来自主题: AI技术研报

10298 点击 2026-02-04 17:24

受 Kimi K2 团队启发，SGLang RL 团队成功落地了 INT4 量化感知训练（QAT）流程方案。通过 “训练端伪量化 + 推理端真实量化（W4A16）” 的方案组合，我们实现了媲美 BF16 全精度训练的稳定性与训推一致性，

来自主题: AI技术研报

6889 点击 2026-02-04 16:32

面对同行评审，许多作者都有过这样的经历：明明回答了审稿人的每一个问题，态度也足够谦卑，为什么最终还是没能打动对方？

来自主题: AI技术研报

7513 点击 2026-02-04 16:30

何恺明团队新论文，再次「大道至简」。

来自主题: AI技术研报

6731 点击 2026-02-04 16:29

不久前在 AGI-Next 前沿峰会上，姚顺雨曾分享过一个核心观点：模型想要迈向高价值应用，核心瓶颈就在于能否「用好上下文（Context）」。

来自主题: AI技术研报

7251 点击 2026-02-04 16:26

AI，是色盲吗?

来自主题: AI技术研报

9992 点击 2026-02-03 16:12