AI资讯新闻榜单内容搜索-Al

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Al
告别纯奖励试错!二次尝试+反思蒸馏,复杂任务提升81%

告别纯奖励试错!二次尝试+反思蒸馏,复杂任务提升81%

告别纯奖励试错!二次尝试+反思蒸馏,复杂任务提升81%

强化学习已经成为大模型后训练阶段的核心方法之一,但一个长期存在的难题始终没有真正解决:现实环境中的反馈往往稀疏且延迟,模型很难从简单的奖励信号中推断出应该如何调整行为。

来自主题: AI技术研报
8327 点击    2026-03-03 14:17
Dense、MoE之外第三条Scaling路径:交大提出JTok模块,省1/3算力

Dense、MoE之外第三条Scaling路径:交大提出JTok模块,省1/3算力

Dense、MoE之外第三条Scaling路径:交大提出JTok模块,省1/3算力

为了松绑参数与计算量,MoE 曾被寄予厚望 。它靠着稀疏激活的专家子网络,在一定程度上实现了模型容量与计算量的解耦 。然而,近期的研究表明,这并非没有代价的免费午餐 :稀疏模型通常具有更低的样本效率 ;随着稀疏度增大,路由负载均衡变得更加困难 ,且巨大的显存开销和通信压力导致其推理吞吐量往往远低于同等激活参数量的 dense 模型 。

来自主题: AI技术研报
8050 点击    2026-03-03 14:15
老师讲 12 小时,不如 AI 教 2 小时?这所高中直接干掉了所有老师,Claude、ChatGPT 也成学生日常

老师讲 12 小时,不如 AI 教 2 小时?这所高中直接干掉了所有老师,Claude、ChatGPT 也成学生日常

老师讲 12 小时,不如 AI 教 2 小时?这所高中直接干掉了所有老师,Claude、ChatGPT 也成学生日常

在近日的一场播客中,曾做出 5 款产品的 AI 创业公司 Every 创始人兼 CEO Dan Shipper 采访了一位特别的年轻人 Alex Mathew。这个来自美国得克萨斯州奥斯汀 Alpha 高中的 17 岁高三学生,同时也是一名 AI 硬件创业者。

来自主题: AI资讯
8387 点击    2026-03-02 10:16
OpenClaw 霸榜,Agent 全面爆发的前夜(附报告原文PDF)

OpenClaw 霸榜,Agent 全面爆发的前夜(附报告原文PDF)

OpenClaw 霸榜,Agent 全面爆发的前夜(附报告原文PDF)

AI 行业,似乎已经提前进入了以个人 Agent 为代表的「后 ChatGPT 时代」。这印证了独立 AI 基准测试机构「Artificial Analysis」的预测结论:2026,Agent 正在全面爆发。近期,他们发布了对 AI 领域发展的全面总结:《2025 年终 AI 发展报告》。

来自主题: AI技术研报
8477 点击    2026-03-02 10:14
GPT之父Alec Radford新作:给大模型做「脑部手术」,危险知识重学成本暴增7000倍

GPT之父Alec Radford新作:给大模型做「脑部手术」,危险知识重学成本暴增7000倍

GPT之父Alec Radford新作:给大模型做「脑部手术」,危险知识重学成本暴增7000倍

近日, Anthropic 和斯坦福研究者 Neil Rathi 与这位传奇研究者联合发布了一篇新论文,并得到了一些相当惊人的新发现。在这项研究中,他们挑战了当前大模型安全领域的一个核心假设。长期以来,业界普遍认为要在模型发布后通过 RLHF 或微调来限制其危险行为。但 Neil Rathi 和 Alec Radford 提出了一种更本质的解法:

来自主题: AI技术研报
8788 点击    2026-03-02 10:12
西湖大学破解Rectified Flow反演不稳定难题,实现零成本稳定增强|ICLR'26

西湖大学破解Rectified Flow反演不稳定难题,实现零成本稳定增强|ICLR'26

西湖大学破解Rectified Flow反演不稳定难题,实现零成本稳定增强|ICLR'26

现有Rectified Flow(RF)模型在反演阶段面临的核心挑战,是逆向ODE对微小误差高度敏感,容易沿着数值不稳定方向偏离前向流形,导致轨迹发散、重建不一致、编辑不可控。为解决这一问题,团队提出PMI(Prox-Mean-Inversion),一种针对RF反演稳定性的轻量化修正机制。

来自主题: AI技术研报
8300 点击    2026-03-02 09:59
美军用AI杀死了哈梅内伊?很抱歉,大家都被营销号骗了。

美军用AI杀死了哈梅内伊?很抱歉,大家都被营销号骗了。

美军用AI杀死了哈梅内伊?很抱歉,大家都被营销号骗了。

作为一名还算资深的AI从业者,我要紧急厘清一个正在疯狂传播的技术谣言。因为就在哈梅内伊身亡的消息确认后仅仅几小时,一篇题为《深度揭秘Claude和Palantir是如何杀死哈梅内伊的》的文章迅速引爆了中文互联网,在朋友圈和各大社群刷屏。

来自主题: AI资讯
9501 点击    2026-03-01 17:59
1亿美元A轮!李飞飞、Karpathy下重注:这家公司要用AI"复制"全人类

1亿美元A轮!李飞飞、Karpathy下重注:这家公司要用AI"复制"全人类

1亿美元A轮!李飞飞、Karpathy下重注:这家公司要用AI"复制"全人类

这个看似科幻的想法,正在被一家名为Simile的公司变成现实。他们刚刚完成了1亿美元的A轮融资,由Index Ventures领投,Hanabi、A星、Bain Capital Ventures参与投资,连人工智能领域的传奇人物Andrej Karpathy、Fei-Fei Li、Adam D'Angelo等都加入了投资行列。

来自主题: AI资讯
9305 点击    2026-03-01 13:29
谷歌AI攻克6道世界级难题,比IMO金牌更震撼!陶哲轩指明新玩法

谷歌AI攻克6道世界级难题,比IMO金牌更震撼!陶哲轩指明新玩法

谷歌AI攻克6道世界级难题,比IMO金牌更震撼!陶哲轩指明新玩法

Google DeepMind最新AI智能体Aletheia在FirstProof挑战赛中,独立攻克了6道世界级数学难题,实现了从竞赛水平到PhD科研级的质变。人类数学研究的「手工时代」或许正步入倒计时。

来自主题: AI资讯
8518 点击    2026-03-01 11:28
ICLR 2026 | 把视频扩散模型压到4bit,还能接近满血效果? QVGen让「超低比特视频生成量化」真正可用

ICLR 2026 | 把视频扩散模型压到4bit,还能接近满血效果? QVGen让「超低比特视频生成量化」真正可用

ICLR 2026 | 把视频扩散模型压到4bit,还能接近满血效果? QVGen让「超低比特视频生成量化」真正可用

香港科技大学 & 北航 & 商汤等提出了一个专门面向视频生成扩散模型的 QAT 范式 ——QVGen,在 3-bit / 4-bit 都能把质量拉回来,并且让 4-bit 首次接近全精度表现成为现实。该论文现已被 ICLR 高分接收:rebuttal 前 88666(top 1.4%),rebuttal 后 88886 (top 0.5%)。

来自主题: AI技术研报
7990 点击    2026-02-28 15:12