AI资讯新闻榜单内容搜索-语言模型

ICCV 2025 | ECD：高质量合成图表数据集，提升开源MLLM图表理解能力

在科研、新闻报道、数据分析等领域，图表是信息传递的核心载体。要让多模态大语言模型（MLLMs）真正服务于科学研究，必须具备以下两个能力

来自主题: AI技术研报

9389 点击 2025-08-22 10:35

GPT-5点赞！八大顶尖机构发布「自进化智能体」全面综述

在AI浪潮席卷全球的2025年，大语言模型（LLM）已从单纯的聊天工具演变为能规划、决策的智能体。但问题来了：这些智能体一旦部署，就如「冻结的冰块」，难以适应瞬息万变的世界。

来自主题: AI技术研报

8379 点击 2025-08-22 10:23

dLLM的「Free Lunch」！浙大&蚂蚁利用中间结果显著提升扩散语言模型

近年来，扩散大语言模型（Diffusion Large Language Models, dLLMs）正迅速崭露头角，成为文本生成领域的一股新势力。与传统自回归（Autoregressive, AR）模型从左到右逐字生成不同，dLLM 依托迭代去噪的生成机制，不仅能够一次性生成多个 token，还能在对话、推理、创作等任务中展现出独特的优势。

来自主题: AI技术研报

9101 点击 2025-08-20 16:26

ICCV 2025 | 跨越视觉与语言边界，打开人机交互感知的新篇章：北大团队提出INP-CC模型重塑开放词汇HOI检测

目前的 HOI 检测方法普遍依赖视觉语言模型（VLM），但受限于图像编码器的表现，难以有效捕捉细粒度的区域级交互信息。本文介绍了一种全新的开集人类-物体交互（HOI）检测方法——交互感知提示与概念校准（INP-CC）。

来自主题: AI技术研报

7962 点击 2025-08-20 11:05

英伟达新研究：小模型才是智能体的未来

大模型OUT，小模型才是智能体的未来！这可不是标题党，而是英伟达最新论文观点：在Agent任务中，大语言模型经常处理重复、专业化的子任务，这让它们消耗大量计算资源，且成本高、效率低、灵活性差。

来自主题: AI资讯

8378 点击 2025-08-19 11:24

开源扩散大模型首次跑赢自回归！上交大联手UCSD推出D2F，吞吐量达LLaMA3的2.5倍

在大语言模型（LLMs）领域，自回归（AR）范式长期占据主导地位，但其逐 token 生成也带来了固有的推理效率瓶颈。此前，谷歌的 Gemini Diffusion 和字节的 Seed Diffusion 以每秒千余 Tokens 的惊人吞吐量，向业界展现了扩散大语言模型（dLLMs）在推理速度上的巨大潜力。

来自主题: AI技术研报

8882 点击 2025-08-18 17:20