AI资讯新闻榜单内容搜索-scaling

复旦北大联合美团LongCat提出TDAR：用“粗思考，细求证”破解Block Diffusion的速度精度悖论

近期，复旦大学 NLP 实验室（FDU NLP）、北京大学知识计算实验室（KCL）联合美团 LongCat Team 提出了一种 Block Diffusion 推理模型 Test-Time Scaling 新框架 TDAR，通过引入 “粗思考，细求证” (Think Coarse Critic Fine, TCCF) 范式与有界自适应置信度解码

来自主题: AI技术研报

7755 点击 2026-03-14 08:39

3B打32B？海外病毒式传播的小模型，竟然来自BOSS直聘

这两年，大模型大厂之间堪比军备竞赛。不论开源还是闭源阵营，为了在指标上领先对手，都在疯狂地卷 Scaling Law，卷算力，卷参数量，已经达到了近乎离谱的程度。

来自主题: AI技术研报

8854 点击 2026-03-09 16:23

Scaling没有墙！Anthropic CEO：AI实验室真相远超公众想象

Anthropic CEO Dario Amodei在摩根士丹利会议上扔出一颗深水炸弹：Scaling Law根本没撞墙，2026年将迎来激进加速。他用棋盘稻米寓言做了个精准比喻——我们正站在第40格，前39格的所有震撼加在一起，不过是后24格的零头。这场指数级狂飙，没人准备好。

来自主题: AI资讯

8723 点击 2026-03-05 10:44

Dense、MoE之外第三条Scaling路径：交大提出JTok模块，省1/3算力

为了松绑参数与计算量，MoE 曾被寄予厚望。它靠着稀疏激活的专家子网络，在一定程度上实现了模型容量与计算量的解耦。然而，近期的研究表明，这并非没有代价的免费午餐：稀疏模型通常具有更低的样本效率；随着稀疏度增大，路由负载均衡变得更加困难，且巨大的显存开销和通信压力导致其推理吞吐量往往远低于同等激活参数量的 dense 模型。

来自主题: AI技术研报

8870 点击 2026-03-03 14:15

9B端侧开源模型跑通百万上下文，面壁全新稀疏-线性混合注意力架构SALA立功了！

最强的大模型，已经把scaling卷到了一个新维度：百万级上下文。

来自主题: AI技术研报

10766 点击 2026-02-12 10:35

硅谷豪赌算力烧到停电，中国团队反向出击！这一刀，直接砍碎Scaling Law

思考token在精不在多。Yuan 3.0 Flash用RAPO+RIRM双杀过度思考，推理token砍75%，网友们惊呼：这就是下一代AI模型的发展方向！

来自主题: AI技术研报

11028 点击 2026-02-11 14:43

凭借 27 万小时真机数据，Generalist 可能是最接近“GPT-1 时刻”的顶级机器人团队

机器人领域是我们长期关注的赛道，而 Generalist 是当前机器人领域中极少数具备长期竞争潜力的公司，核心优势集中在数据规模、团队能力与清晰的 scaling 路径上。

来自主题: AI资讯

8715 点击 2026-01-30 10:36

EmbodiChain开源，用100%生成式数据自动训练具身智能模型

大语言模型的爆发，让大家见证了 Scaling Law 的威力：只要数据够多、算力够猛，智能似乎就会自动涌现。但在机器人领域，这个公式似乎失效了。

来自主题: AI技术研报

7056 点击 2026-01-20 17:21

纽约时报：OpenAI或将在18个月内现金流枯竭

2026 年危机逼近，OpenAI 虽创下 400 亿美元融资纪录，但内部预测 2028 年亏损将扩大至 450 亿美元。不同于有传统业务「输血」的科技巨头，独立 AI 公司受困于 Scaling Laws 带来的指数级成本爆炸。奥特曼的万亿豪赌或难以为继，OpenAI 恐面临被吞并结局，AI 泡沫时代即将硬着陆。

来自主题: AI资讯

8461 点击 2026-01-19 16:49

2026年，大模型训练的下半场属于「强化学习云」

2024 年底，硅谷和北京的茶水间里都在讨论同一个令人不安的话题：Scaling Law 似乎正在撞墙。

来自主题: AI技术研报

9557 点击 2026-01-12 15:13