AI资讯新闻榜单内容搜索-多模态数据

ICCV 2025 | 打造通用工具智能体的基石：北大提出ToolVQA数据集，引领多模态多步推理VQA新范式

本文提出了一个旨在提升基础模型工具使用能力的大型多模态数据集 ——ToolVQA。现有研究已在工具增强的视觉问答（VQA）任务中展现出较强性能，但在真实世界中，多模态任务往往涉及多步骤推理与功能多样的工具使用，现有模型在此方面仍存在显著差距。

来自主题: AI技术研报

7933 点击 2025-08-22 16:20

近期，随着OpenAI-o1/o3和Deepseek-R1的成功，基于强化学习的微调方法（R1-Style）在AI领域引起广泛关注。这些方法在数学推理和代码智能方面展现出色表现，但在通用多模态数据上的应用研究仍有待深入。

来自主题: AI技术研报

9388 点击 2025-08-01 16:08

你有没有想过，为什么那些最聪明的AI工程师要把80%的时间浪费在修复数据基础设施上，而不是构建真正改变世界的AI应用？这个看似不合理的现象，正是Eventual创始人Sammy Sidhu和Jay Chia在Lyft自动驾驶部门工作时亲身经历的痛苦。

来自主题: AI资讯

8966 点击 2025-07-09 12:55

在多模态大语言模型（MLLMs）应用日益多元化的今天，对模型深度理解和分析人类意图的需求愈发迫切。尽管强化学习（RL）在增强大语言模型（LLMs）的推理能力方面已展现出巨大潜力，但将其有效应用于复杂的多模态数据和格式仍面临诸多挑战。

来自主题: AI技术研报

9815 点击 2025-07-09 10:59

该大模型由海洋精准感知技术全国重点实验室(浙江大学)牵头研发，具备基础的海洋专业知识问答，以及声呐图像、海洋观测图等海洋特色多模态数据的自然语言解读能力。其采用的领域知识增强“慢思考”推理机制，相较现有通用大模型能有效降低幻觉式错误。

来自主题: AI资讯

8174 点击 2025-06-29 17:03

随着大模型的不断发展，多模态数据处理成为了新的热点领域。多模态生成任务主要通过整合多种类型的数据，如文本、图像、音频等，实现不同模态之间的相互转换与生成。

来自主题: AI资讯

8576 点击 2025-06-17 11:39

大模型的发展正在遭遇瓶颈。随着互联网文本数据被大规模消耗，基于数字世界训练的AI模型性能提升速度明显放缓。与此同时，物理世界中蕴藏着数字世界数百倍甚至千倍的多模态数据，这些数据远未被有效利用，成为AI发展的下一个重要方向。

来自主题: AI资讯

9719 点击 2025-06-07 15:09

2025年4月16日，Cohere 发布了其最新一代多模态搜索模型 Embed 4，在多模态数据处理、长文本建模和跨模态检索能力上实现了显著提升，进一步巩固了其在企业级 AI 搜索领域的领先地位。

来自主题: AI资讯

6966 点击 2025-04-18 10:16

面对AI圈疯传的「数据如化石燃料一般正在枯竭」，我们该如何从海量数据中掘金？AI炼出的数据飞轮2.0，或许就是答案。

来自主题: AI资讯

7586 点击 2024-12-19 13:10

开源多模态大模型或将开始腾飞。

来自主题: AI技术研报

8595 点击 2024-07-27 19:29