AI资讯新闻榜单内容搜索-SAGE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: SAGE
清华第三代Sage注意力发布!提速5倍,精度不降,训推都能用

清华第三代Sage注意力发布!提速5倍,精度不降,训推都能用

清华第三代Sage注意力发布!提速5倍,精度不降,训推都能用

清华大学朱军教授团队提出SageAttention3,利用FP4量化实现推理加速,比FlashAttention快5倍,同时探索了8比特注意力用于训练任务的可行性,在微调中实现了无损性能。

来自主题: AI技术研报
5960 点击    2025-07-08 12:08
Cursor定价风波:从“按次”到“按量”,官方致歉并退款!

Cursor定价风波:从“按次”到“按量”,官方致歉并退款!

Cursor定价风波:从“按次”到“按量”,官方致歉并退款!

2025年6月,AI 代码编辑器 Cursor 因定价模式调整引发广泛争议。原先的“按次计费”(per-request billing)改为基于 token 的“按量计费”(usage-based pricing),导致部分用户面临意外扣费,社区反馈强烈Cursor 于7月5日发布致歉声明,承诺退款并澄清新计费模式。

来自主题: AI资讯
8100 点击    2025-07-07 15:33
清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

随着大型模型需要处理的序列长度不断增加,注意力运算(Attention)的时间开销逐渐成为主要开销。

来自主题: AI技术研报
7153 点击    2025-06-19 10:47
红杉合伙人:使用数据(Usage)才是 AI 时代的护城河

红杉合伙人:使用数据(Usage)才是 AI 时代的护城河

红杉合伙人:使用数据(Usage)才是 AI 时代的护城河

护城河是所有投资人和创始人都非常关注的一个概念,因为它涉及到企业的长期价值和生死存亡。AI 时代,大家对护城河同样有执念,但是越来越搞不懂什么才是这个时代的护城河了,甚至是否还有护城河都已经是一个问题。

来自主题: AI资讯
6722 点击    2025-03-29 09:45
4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

大模型中,线性层的低比特量化已经逐步落地。然而,对于注意力模块,目前几乎各个模型都还在用高精度(例如 FP16 或 FP32)的注意力运算进行训练和推理。并且,随着大型模型需要处理的序列长度不断增加,Attention(注意力运算)的时间开销逐渐成为主要开销。

来自主题: AI技术研报
6688 点击    2024-12-27 09:44
又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

来自主题: AI技术研报
8678 点击    2024-10-19 14:15
鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好

鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好

鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好

鹅厂搞了个150多人的“翻译公司”,从老板到员工都是AI智能体! 主营业务是翻译网络小说,质量极高,参与评价的读者认为比真人翻译得还要好。 而且相比于雇佣真人,用它来翻译文学作品,成本降低了近80倍。

来自主题: AI技术研报
9962 点击    2024-05-25 18:41
曝苹果自研大模型Ajax新进展,改造Siri等全系应用,推出文本摘要工具

曝苹果自研大模型Ajax新进展,改造Siri等全系应用,推出文本摘要工具

曝苹果自研大模型Ajax新进展,改造Siri等全系应用,推出文本摘要工具

据AppleInsider 5月3日报道,苹果正在计划为其系统组件引入一系列AI增强功能,其中Safari、Messages、Mail、Spotlight Search和Siri将成为首批接受AI升级的应用。

来自主题: AI资讯
8258 点击    2024-05-08 19:00