AI资讯新闻榜单内容搜索-io

上交大等探索键值压缩的边界：MILLION开源框架定义模型量化推理新范式，入选顶会DAC 2025

在以 transformer 模型为基础的大模型中，键值缓存虽然用以存代算的思想显著加速了推理速度，但在长上下文场景中成为了存储瓶颈。为此，本文的研究者提出了 MILLION，一种基于乘积量化的键值缓存压缩和推理加速设计。

来自主题: AI技术研报

9864 点击 2025-04-30 08:32

做浏览器、买Chrome、争AI OS，Perplexity也想「上牌桌」

Perplexity CEO Aravind Srinivas 近日在接受 TheVerge 采访时表示，「Perplexity 最终的目标是构建像 Windows、Mac、Android 或 iOS 这样的操作系统，操作系统才是最终极的战场。」

来自主题: AI资讯

10677 点击 2025-04-29 09:59

RAG性能暴增20%！清华等推出“以笔记为中心”的深度检索增强生成框架，复杂问答效果飙升

在当前大语言模型（LLMs）广泛应用于问答、对话等任务的背景下，如何更有效地结合外部知识、提升模型对复杂问题的理解与解答能力，成为 RAG（Retrieval-Augmented Generation）方向的核心挑战。

来自主题: AI技术研报

9574 点击 2025-04-29 08:55

264页 Agent 综述！MetaGPT、Mila、斯坦福、耶鲁、谷歌半年共同撰写

，MetaGPT & Mila 联合全球范围内 20 个顶尖研究机构的 47 位学者，共同撰写并发布了长篇综述《Advances and Challenges in Foundation Agents:

来自主题: AI技术研报

13803 点击 2025-04-27 10:41

秒杀同行！Kimi开源全新音频基础模型，横扫十多项基准测试，总体性能第一

六边形战士来了。

来自主题: AI技术研报

9718 点击 2025-04-26 17:53

ICLR 2025 Oral | 训练LLM，不只是多喂数据，PDS框架给出最优控制理论选择

近年来，大语言模型（LLMs）在自然语言理解、代码生成与通用推理等任务上取得了显著进展，逐步成为通用人工智能的核心基石。

来自主题: AI技术研报

9573 点击 2025-04-26 14:36

外媒爆料：Manus完成7500万美元融资，估值近5亿美元、比上轮增长5倍

外媒报道，Manus 最近完成了一轮由美国风险投资公司 Benchmark 领投的 7500 万美元的融资。蝴蝶效应计划利用这笔资金将其服务扩展到包括美国、日本和中东在内的其他市场。据 The Information 上周报道，Manus 使用 Anthropic 的 Claude AI 模型及其他工具，平均每个任务需向 Anthropic 支付 2 美元。

来自主题: AI资讯

10170 点击 2025-04-25 21:44