JustGRPO:扩散语言模型的极简主义回归 JustGRPO:扩散语言模型的极简主义回归 关键词: AI,模型训练,JustGRPO,扩散模型 扩散语言模型(Diffusion LLMs, dLLMs)因支持「任意顺序生成」和并行解码而备受瞩目。直觉上,打破传统自回归(AR)「从左到右」的束缚,理应赋予模型更广阔的解空间,从而在数学、代码等复杂任务上解锁更强的推理潜力。 来自主题: AI技术研报 9564 点击 2026-01-29 14:55