AI资讯新闻榜单内容搜索-压缩

有人只用API就猜出了GPT、Claude、Gemini的参数量？社区吵翻了

基于此，研究者在 89 个参数量已知的开源模型（规模从 1.35 亿到 1.6 万亿参数）上拟合出事实准确率与参数量的对数线性关系，拟合优度 R² = 0.917，并据此对闭源模型进行参数估算。

来自主题: AI技术研报

9458 点击 2026-05-01 13:13

中国AI医疗超级智能体亮相！手握国内最大医学影像数据库，准确率近90%！

AI医疗最成熟的领域，迎来了一款重磅产品——颅脑CT超级智能体“小君医生2.0”。这是全球首个临床可用+检查项目级的颅脑CT智能体，能够覆盖90%的颅脑病变，诊断准确率达87.8%，90%以上病例无需修改或仅小幅度修改即可使用，将报告时效从15分钟大幅压缩至1分钟，已落地中国顶流三甲北京天坛医院，极大提升了医院影像诊断的效率。

来自主题: AI资讯

9923 点击 2026-04-30 20:38

世界模型真正的壁垒，可能是表征压缩，对话SparcAI95后创始人李智昊、王雨飞

过去十年，压缩在 CV 学术圈一直是个边缘方向——做生成、做大模型才是显学。但 SparcAI 的两位95后创始人各自做了多年压缩，然后在同一间 NTU 实验室相遇，两年后发布了 Sparc3D。模型 demo 上线当日冲上 HuggingFace Trending 榜首，论文被 NeurIPS 2025 录用。如今他们创办了 SparcAI，目标是一家世界模型公司。

来自主题: AI资讯

9340 点击 2026-04-30 09:03

腾讯掀桌！0.4G翻译模型，手机断网都能跑，比谷歌翻译得好

今日，腾讯混元开源翻译模型Hy-MT1.5-1.8B-1.25bit。该模型仅0.4G，就实现了33种语言高质量互译，且下载后可直接在手机本地离线运行，翻译表现优于谷歌翻译。这一原始模型的参数规模为1.8B，为降低用户手机内存压力，腾讯混元团队通过量化压缩推出了适配中高性能手机的2-bit、适配全系列手机的1.25-bit两种方案，模型体积分别被压缩至574MB、440MB。

来自主题: AI资讯

9148 点击 2026-04-29 18:19

ACL 2026 | LCA：DeepSeek 长文本加速神器，90% KV 缓存缩减 + 2.5 倍推理提速

近日，琶洲实验室、华南理工大学、蔻町（AIGCode）等单位科研团队联合提出潜在空间压缩注意力（Latent-Condensed Attention，LCA），研究成果入选 ACL 2026。

来自主题: AI技术研报

8754 点击 2026-04-29 09:35

大模型高效推理新答案：ICLR 2026提出Balanced Thinking，精度提升10.0的同时，推理长度直降35.4%

哈尔滨工业大学（深圳）等机构的研究者提出了 ReBalance 方法，并首次系统性引入 Balanced Thinking 这一新视角。该工作的核心观点明确：高效推理的关键并非盲目压缩推理长度，而是在过度思考与思考不足之间维持动态平衡。

来自主题: AI技术研报

8240 点击 2026-04-27 09:53

「压缩，就是你所需要的全部」！菲尔兹奖得主Michael Freedman新作揭开数学真相

当谈及数学时，我们近乎本能地认为，数学是一个严谨、精确、不容置疑的完美逻辑体系，但在菲尔兹奖得主迈克尔・弗里德曼（Michael Freedman）眼中，人类真正创造和关心的数学，本质上是「柔软且可塑」的。

来自主题: AI资讯

10140 点击 2026-04-21 09:36

ICLR 2026｜隐式思考模型LRT：「隐式思维链」推理，更快更强！

近日，哈尔滨工业大学（深圳）联合深圳河套学院、Independent Researcher提出了隐式思考模型 LRT（Latent Reasoning Tuning），通过一个轻量级的推理网络，将大模型冗长的「思维链」压缩为紧凑的隐式向量表征，一次前向计算即可完成推理，无需逐 token 生成数千字的中间推理过程。

来自主题: AI技术研报

10358 点击 2026-04-13 09:35

重磅！Anthropic又一个平台级产品炸场:Harness难题一次性解决，把Agent宠物变成牲口

Anthropic推出平台级产品：Claude Managed Agents，开发周期从数月压缩到几天,To B业务更进一步，这是直接给了一个Harness Agent的盒子，用户只管干活就行了，随着产品发布，A厂还发布了一篇Harness（Managed Agents）工程细节文章，感觉A厂就差说在座的都是xx了，再一次遥遥领先！我们一文来说清楚

来自主题: AI资讯

8871 点击 2026-04-09 11:22

2倍提速！KV缓存压缩不只看重要性，上交大团队让模型推理「又快又稳」 | ICLR'26

长上下文推理已经成了VLM/LLM的默认形态。

来自主题: AI技术研报

6359 点击 2026-04-01 09:40