多模态推理新范式!DiffThinker:用扩散模型「画」出推理和答案 多模态推理新范式!DiffThinker:用扩散模型「画」出推理和答案 关键词: AI,模型训练,DiffThinker,扩散模型 在多模态大模型(MLLMs)领域,思维链(CoT)一直被视为提升推理能力的核心技术。然而,面对复杂的长程、视觉中心任务,这种基于文本生成的推理方式正面临瓶颈:文本难以精确追踪视觉信息的变化。形象地说,模型不知道自己想到哪一步了,对应图像是什么状态。 来自主题: AI技术研报 6245 点击 2026-01-08 15:20