小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构
小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构小米MiMo大模型团队,加入AI拜年战场——推出HySparse,一种面向Agent时代的混合稀疏注意力架构。
小米MiMo大模型团队,加入AI拜年战场——推出HySparse,一种面向Agent时代的混合稀疏注意力架构。
最近,一家名为 Domus Next 的 AI 公司,在美国科技圈内引起了业界的广泛关注。它的产品 Nori,在 2026 年 1 月正式发布前,仅通过为期一个月的私密内测,就悄然渗透进了超过 10 万个家庭,发布当天在 App 生产力排行榜一度超过了 Google Calendar 和 Google Keep,还超过了 Perplexity、Manus 等一众 AI 产品。
扩散语言模型(Diffusion Language Models, DLLMs)因其多种潜在的特性而备受关注,如能加速的非自回归并行生成特性,能直接起草编辑的特性,能数据增强的特性。然而,其模型能力往往落后于同等规模的强力自回归(AR)模型。
绷不住了!OpenAI深陷高管离职潮,内部“红色警报”再次拉响。
近日,美团推出全新多模态统一大模型方案 STAR(STacked AutoRegressive Scheme for Unified Multimodal Learning),凭借创新的 "堆叠自回归架构 + 任务递进训练" 双核心设计,实现了 "理解能力不打折、生成能力达顶尖" 的双重突破。
这两天我在扫 X 推文的时候,有一个名字出现的频率明显变高了:Fanvue,一个创作者订阅平台。
为了给OpenAI凑齐3000亿美金的算力投名状,硅谷老教父Larry Ellison杀疯了!3万名员工集体祭天,283亿美金买回来的医疗巨头Cerner直接送上拍卖台。为了买显卡,甲骨文正在自残?
上周末,号称「AI 版 Reddit」的 Moltbook 闹得沸沸扬扬。
2月2日,X上一位的知名AI博主Pankaj Kumar (@pankajkumar_dev),爆料了Anthropic的下一代旗舰模型Claude Sonnet 5。这个模型代号为“Fennec”,可能在明天或者后天就要正式发布了。
提供智能化网络安全平台以协助企业检测、调查并清除身份欺诈的Outtake,已成功筹集 4000 万美元 B 轮融资。