AI资讯新闻榜单内容搜索-压缩

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 压缩
现在,轮到人类给AI讲故事了?

现在,轮到人类给AI讲故事了?

现在,轮到人类给AI讲故事了?

继“结构式”“压缩式”“共振式”之后,一直在想第四种与 AI 交流的路,可能会是什么?

来自主题: AI资讯
8591 点击    2025-05-23 10:54
上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025

上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025

上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025

在以 transformer 模型为基础的大模型中,键值缓存虽然用以存代算的思想显著加速了推理速度,但在长上下文场景中成为了存储瓶颈。为此,本文的研究者提出了 MILLION,一种基于乘积量化的键值缓存压缩和推理加速设计。

来自主题: AI技术研报
9532 点击    2025-04-30 08:32
70%大小,100%准确!完美压缩LLM性能0损失,推理速度最高飙升39倍

70%大小,100%准确!完美压缩LLM性能0损失,推理速度最高飙升39倍

70%大小,100%准确!完美压缩LLM性能0损失,推理速度最高飙升39倍

LLM的规模爆炸式增长,传统量化技术虽能压缩模型,却以牺牲精度为代价。莱斯大学团队的最新研究DFloat11打破这一僵局:它将模型压缩30%且输出与原始模型逐位一致!更惊艳的是,通过针对GPU的定制化解压缩内核,DFloat11使推理吞吐量提升最高38.8倍。

来自主题: AI技术研报
9330 点击    2025-04-28 09:05
Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强

Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强

Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强

Nemotron-H模型混合了Transformer和Mamba架构,使长文本推理速度提升3倍,同时还能保持高性能,开源版本包括8B和56B尺寸。训练过程采用FP8训练和压缩技术,进一步提高了20%推理速度

来自主题: AI产品测评
9408 点击    2025-04-20 20:47
聚焦个性化学习,夸克不想做一个千篇一律的“AI+教育”

聚焦个性化学习,夸克不想做一个千篇一律的“AI+教育”

聚焦个性化学习,夸克不想做一个千篇一律的“AI+教育”

从人们被大模型“震撼”完开始思考如何把这项技术用起来的第一天,教育就是被很多人天然想到的场景。一个能压缩全世界知识的AI,天然就是一个人类想象里“老师”的样子。

来自主题: AI资讯
9348 点击    2025-04-17 13:58
诺奖得主震撼宣言:AI一年完成10亿年「博士研究时间」!

诺奖得主震撼宣言:AI一年完成10亿年「博士研究时间」!

诺奖得主震撼宣言:AI一年完成10亿年「博士研究时间」!

诺奖得主Demis Hassabis表示,通过AI,DeepMind团队在一年里,完成了10亿年的博士研究时间!10亿年的科学探索被压缩到了一年之内,或许这才代表了AI技术的最高使命。

来自主题: AI资讯
8588 点击    2025-04-15 10:25
速递|Pruna AI开源模型压缩"工具箱",已完成种子轮融资650万美元

速递|Pruna AI开源模型压缩"工具箱",已完成种子轮融资650万美元

速递|Pruna AI开源模型压缩"工具箱",已完成种子轮融资650万美元

欧洲初创公司 Pruna AI 一直在研究 AI 模型的压缩算法,该公司的优化框架将于周四开源。Pruna AI 在几个月前完成了 650 万美元的种子轮融资。参与此次初创公司投资的包括 EQT Ventures、Daphni、Motier Ventures 以及 Kima Ventures。

来自主题: AI资讯
9220 点击    2025-03-21 14:28
不到十分钟,用 谜境 Agent 即可轻松创建互动小说

不到十分钟,用 谜境 Agent 即可轻松创建互动小说

不到十分钟,用 谜境 Agent 即可轻松创建互动小说

国内首款全流程 AI 互动小说创作工具「谜境 Agent」于近日上线,该工具通过整合剧本生成、美术绘制、交互设计等模块,将传统需要 4-6 个月的开发周期压缩至 10 分钟内完成。

来自主题: AI资讯
6157 点击    2025-03-17 09:50