AI资讯新闻榜单内容搜索-大型语言模型

「有望成为Transformer杀手」，谷歌DeepMind新架构MoR实现两倍推理速度

大型语言模型已展现出卓越的能力，但其部署仍面临巨大的计算与内存开销所带来的挑战。随着模型参数规模扩大至数千亿级别，训练和推理的成本变得高昂，阻碍了其在许多实际应用中的推广与落地。

来自主题: AI技术研报

7775 点击 2025-07-18 11:58

LeCun团队揭示LLM语义压缩本质：极致统计压缩牺牲细节

那问题来了：大型语言模型（LLM）虽然语言能力惊人，但它们在语义压缩方面能做出和人类一样的权衡吗？为探讨这一问题，图灵奖得主LeCun团队，提出了一种全新的信息论框架。该框架通过对比人类与LLM在语义压缩中的策略，揭示了两者在压缩效率与语义保真之间的根本差异：LLM偏向极致的统计压缩，而人类更重细节与语境。

来自主题: AI技术研报

7165 点击 2025-07-06 11:17

微软推出深度视频探索智能体，登顶多个长视频理解基准

尽管大型语言模型（LLMs）和大型视觉 - 语言模型（VLMs）在视频分析和长语境处理方面取得了显著进展，但它们在处理信息密集的数小时长视频时仍显示出局限性。

来自主题: AI技术研报

8180 点击 2025-06-30 14:34

解读大型推理模型的 “思维奥秘”：从“推理图”视角看模型的「啊哈时刻」

在人工智能领域，大型语言模型（LLM）的推理能力正以前所未有的速度发展。

来自主题: AI资讯

7164 点击 2025-06-21 17:58

推荐大模型来了？OneRec论文解读：端到端训练如何同时吃掉效果与成本

人人都绕不开的推荐系统，如今正被注入新的 AI 动能。随着 AI 领域掀起一场由大型语言模型（LLM）引领的生成式革命，它们凭借着强大的端到端学习能力、海量数据理解能力以及前所未有的内容生成潜力，开始重塑各领域的传统技术栈。

来自主题: AI技术研报

10074 点击 2025-06-20 11:08

DPO与GRPO谁更胜一筹？港中文、北大等联合发布首个系统性对比研究

近年来，强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力，其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大主流算法。

来自主题: AI技术研报

9384 点击 2025-06-20 10:53

想知道你的LLM API被过度收费了吗？隐藏的Tokens终于可以被审计了

近年来，大型语言模型（LLM）在处理复杂任务方面取得了显著进展，尤其体现在多步推理、工具调用以及多智能体协作等高级应用中。这些能力的提升，往往依赖于模型内部一系列复杂的「思考」过程或 Agentic System 中的 Agent 间频繁信息交互。

来自主题: AI技术研报

9010 点击 2025-06-18 11:05

搜索智能体RAG落地不佳？UIUC开源s3，仅需2.4k样本，训练快效果好

当前，Agentic RAG（Retrieval-Augmented Generation）正逐步成为大型语言模型访问外部知识的关键路径。但在真实实践中，搜索智能体的强化学习训练并未展现出预期的稳定优势。一方面，部分方法优化的目标与真实下游需求存在偏离，另一方面，搜索器与生成器间的耦合也影响了泛化与部署效率。

来自主题: AI技术研报

9224 点击 2025-06-17 09:46

喝点VC｜a16z谈搜索大变局：搜索迈入由语言模型主导的“生成式引擎优化（GEO）”全新范式

搜索行为从传统浏览器向大型语言模型（LLM）平台迁移，价值超800亿美元的SEO市场根基已现裂痕，搜索迈入由语言模型主导的“生成式引擎优化（GEO）”全新范式。

来自主题: AI资讯

9380 点击 2025-06-12 18:08

真实联网搜索Agent，7B媲美满血R1，华为盘古DeepDiver给出开域信息获取新解法

大型语言模型 (LLM) 的发展日新月异，但实时「内化」与时俱进的知识仍然是一项挑战。如何让模型在面对复杂的知识密集型问题时，能够自主决策获取外部知识的策略？

来自主题: AI技术研报

9298 点击 2025-06-05 16:43