不止于量化:最新综述用「时-空-构」三维视角解构KV Cache系统级优化
不止于量化:最新综述用「时-空-构」三维视角解构KV Cache系统级优化近期,来自墨尔本大学和华中科技大学的研究者们发布了一篇深度综述,从 MLSys 的思维出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化方法进行了系统性梳理与深入分析,并将相关资源整理成了持续维护的 Awesome 资源库,方便研究者与从业人员快速定位与落地。
搜索
近期,来自墨尔本大学和华中科技大学的研究者们发布了一篇深度综述,从 MLSys 的思维出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化方法进行了系统性梳理与深入分析,并将相关资源整理成了持续维护的 Awesome 资源库,方便研究者与从业人员快速定位与落地。
o1从榜首暴跌至#56,Claude 3 Opus坠入#139。LMSYS榜单揭示残酷真相:大模型的「霸主保质期」只有35天!这不是技术迭代,这是对所有应用层开发者的降维屠杀。
“卡买回来了,然后呢?”
Hinton百万引用的背后,是数篇奠基「现代人工智能」的不朽之作!
巨头们围绕AI的人才争夺战,现在不止于计算机领域了。
新年第一天,DeepSeek 发布了一篇艰深晦涩的技术论文,不少网友直呼「看不懂」。
在 Claude 推出 Cowork 功能后,一个明显的信号 —— Agent 不仅仅是辅助工具,而是一种可以被设计、被组织、被反复调用的协作单元。
今天,OpenAI在ChatGPT网页端悄悄推出了独立的翻译功能——ChatGPT Translate。乍一看,它与谷歌翻译等传统翻译工具颇为类似。真正将二者区分开来的,可能是翻译后ChatGPT Translate提供的交互与个性化调整能力。
Michael Truell让Cursor中的GPT-5.2连续运行了整整一周。不是一小时,不是一天,而是不眠不休,昼夜不停,168小时持续写代码。结果?300万行代码。数千个文件。
去年下半年,B2、B3两轮融资的钱还没捂热,这不,就在刚刚,新鲜热乎C1轮融资又双叒叕光速到位~行业首个实现双向对话、实时翻译的智能眼镜INMO GO3,首发仅3天,全渠道预订量就突破20000台。