
只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max
只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是如此 。
来自主题: AI技术研报
6883 点击 2025-05-26 09:59
近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是如此 。
不再依赖语言,仅凭图像就能完成模型推理?