AI资讯新闻榜单内容搜索-多模态推理

感知错误率降低30.5%：隐式感知损失让模型主动“睁大眼睛” | UIUC＆阿里通义

让大模型在学习推理的同时学会感知。伊利诺伊大学香槟分校（UIUC）与阿里巴巴通义实验室联合推出了全新的专注于多模态推理的强化学习算法PAPO(Perception-Aware Policy Optimization)。

来自主题: AI技术研报

7686 点击 2025-07-11 16:23

昆仑万维开源最强多模态推理模型！性能逼近人类专家，还超了OpenAI、Anthropic

今日，昆仑万维重磅开源多模态推理模型Skywork-R1V 3.0，这是其迄今最强多模态推理模型，参数规模为38B，在多个多模态推理基准测试中取得了开源最佳（SOTA）性能。

来自主题: AI资讯

10737 点击 2025-07-09 21:42

统一框架下的具身多模态推理：自变量机器人让AI放下海德格尔的锤子

当 AI 放下海德格尔的锤子时，意味着机器人已经能够熟练使用工具，工具会“隐退”成为本体的延伸，而不再是需要刻意思考的对象。

来自主题: AI技术研报

9513 点击 2025-06-18 15:35

AI真有希望考清北了！豆包1.6多模态推理发威，闯关数理化带图大题

豆包大模型1.6惊艳亮相，成为国内首款多模态SOTA模型，256k对话窗口，深度思考最长上下文。它不仅能看会想，还能动手操作GUI，国内最有潜力考清北。

来自主题: AI技术研报

8118 点击 2025-06-12 17:04

专访张祥雨：多模态推理和自主学习是未来的 2 个「GPT-4」时刻

本期内容是拾象 CEO 李广密对大模型公司阶跃星辰首席科学家张祥雨的访谈。

来自主题: AI资讯

8518 点击 2025-06-08 15:06

多模态推理新基准！最强Gemini 2.5 Pro仅得60分，复旦港中文上海AILab等出品

逻辑推理是人类智能的核心能力，也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现，研究人员开始探索如何将推理能力引入多模态大模型(MLLMs)

来自主题: AI技术研报

9032 点击 2025-06-07 10:35

视觉感知驱动的多模态推理，阿里通义提出VRAG，定义下一代检索增强生成

在数字化时代，视觉信息在知识传递和决策支持中的重要性日益凸显。然而，传统的检索增强型生成（RAG）方法在处理视觉丰富信息时面临着诸多挑战。一方面，传统的基于文本的方法无法处理视觉相关数据；另一方面，现有的视觉 RAG 方法受限于定义的固定流程，难以有效激活模型的推理能力。

来自主题: AI技术研报

8423 点击 2025-06-04 09:28

SFT在帮倒忙？新研究：直接进行强化学习，模型多模态推理上限更高

「尽管经过 SFT 的模型可能看起来在进行推理，但它们的行为更接近于模式模仿 —— 一种缺乏泛化推理能力的伪推理形式。」

来自主题: AI技术研报

8411 点击 2025-06-02 15:24

ICML 2025 Spotlight | 多模态大模型暴露短板？EMMA基准深度揭秘多模态推理能力

「三个点电荷 + Q、-2Q 和 + 3Q 等距放置，哪个向量最能描述作用在 + Q 电荷上的净电力方向？」

来自主题: AI技术研报

9322 点击 2025-05-20 15:04

高考考上985的AI来了！超强数理推理横扫真题，训练秘籍剑指AGI

昆仑万维Skywork-R1V 2.0版本，开源了！这一次，它的多模态推理实现了再进化，成为最强高考数理解题利器，直接就是985水平。而团队也大方公开了各项技术秘籍，亮点满满。可以说，R1V 2.0已成为团队AGI之路上的又一里程碑。

来自主题: AI技术研报

8520 点击 2025-04-24 17:54

AI资讯新闻榜单内容搜索-多模态推理

感知错误率降低30.5%：隐式感知损失让模型主动“睁大眼睛” | UIUC＆阿里通义

昆仑万维开源最强多模态推理模型！性能逼近人类专家，还超了OpenAI、Anthropic

统一框架下的具身多模态推理：自变量机器人让AI放下海德格尔的锤子

AI真有希望考清北了！豆包1.6多模态推理发威，闯关数理化带图大题

专访张祥雨：多模态推理和自主学习是未来的 2 个 「GPT-4」 时刻

多模态推理新基准！最强Gemini 2.5 Pro仅得60分，复旦港中文上海AILab等出品

视觉感知驱动的多模态推理，阿里通义提出VRAG，定义下一代检索增强生成

SFT在帮倒忙？新研究：直接进行强化学习，模型多模态推理上限更高

ICML 2025 Spotlight | 多模态大模型暴露短板？EMMA基准深度揭秘多模态推理能力

高考考上985的AI来了！超强数理推理横扫真题，训练秘籍剑指AGI

专访张祥雨：多模态推理和自主学习是未来的 2 个「GPT-4」时刻