AI资讯新闻榜单内容搜索-Multi

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

尽管 DeepSeek-R1 在单模态推理中取得了显著成功，但已有的多模态尝试（如 R1-V、R1-Multimodal-Journey、LMM-R1）尚未完全复现其核心特征。

来自主题: AI技术研报

7948 点击 2025-03-14 15:32

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界，特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头潜在注意力网络（Multi-head Latent Attention, MLA）是其经济推理架构的核心之一，通过对键值缓存进行低秩压缩，显著降低推理成本 [1]。

来自主题: AI技术研报

5746 点击 2025-03-07 10:24

Agent这两天随着邀请码进入公众视野，展示了不凡的推理能力。然而，当面对需要精确规划和深度推理的复杂问题时，即使是最先进的LLMs也常常力不从心。Google研究团队提出的PlanGEN框架，正是为解决这一挑战而生。

来自主题: AI技术研报

3931 点击 2025-03-06 16:55

随着R1等先进推理模型展现出接近人类的推理能力，多代理系统（Multi-Agent Systems，MAS）的发展也出现了前所未有的机遇。然而，随着我们尝试构建越来越复杂的多代理系统，一个核心问题日益凸显：如何在保持系统灵活性的同时，降低开发和维护的复杂度？

来自主题: AI技术研报

8221 点击 2025-03-04 16:12

Phi-4系列模型上新了！56亿参数Phi-4-multimodal集语音、视觉、文本多模态于一体，读图推理性能碾压GPT-4o；另一款38亿参数Phi-4-mini在推理、数学、编程等任务中超越了参数更大的LLM，支持128K token上下文。

来自主题: AI技术研报

6011 点击 2025-02-28 14:11

在实际应用中，我们常常需要模型输出具有严格结构的数据，比如生物制药生产记录、金融交易报告或医疗健康档案等。这种结构化输出的需求在生物制造、金融服务、医疗健康等严格监管的领域尤为重要。

来自主题: AI技术研报

4036 点击 2025-02-27 10:25

随着AI工具越来越普及，类似Deep Researh这样的工具越来越好用，科学研究成果呈现爆炸式增长。以arXiv为例，仅2024年10月就收到超过24,000篇论文提交。

来自主题: AI技术研报

9368 点击 2025-02-24 10:09

随着语言大模型的成功，视觉 - 语言多模态大模型 (Vision-Language Multimodal Models, 简写为 VLMs) 发展迅速，但在长上下文场景下表现却不尽如人意，这一问题严重制约了多模态模型在实际应用中的潜力。

来自主题: AI技术研报

8064 点击 2025-01-15 14:23

2024 年，我花了相当一部分时间在研究多智能体系统，主要是 AutoGen，一个用于构建 AI 应用的 OSS 框架，并为此写了一本书《Multi-Agent Systems with AutoGen》。

来自主题: AI资讯

8742 点击 2025-01-15 10:21

检索-增强生成 (RAG) 是一个永不过时的话题，并在不断扩展以增强LLMs 的功能。对于那些不太熟悉RAG 的人来说：这种方法利用外部知识来增强模型的能力，从外部资源中检索您实际需要的信息。

来自主题: AI技术研报

6294 点击 2025-01-10 11:01