AI资讯新闻榜单内容搜索-训练

ICML 2025｜如何凭「自动补全」实现100K生成3×加速？

在当前大模型推理愈发复杂的时代，如何快速、高效地产生超长文本，成为了模型部署与优化中的一大核心挑战。

来自主题: AI技术研报

9360 点击 2025-05-18 14:38

图像分词器造反了！华为 Selftok：自回归内核完美统一扩散模型，触发像素自主推理

自回归（AR）范式凭借将语言转化为离散 token 的核心技术，在大语言模型领域大获成功 —— 从 GPT-3 到 GPT-4o，「next-token prediction」以简单粗暴的因果建模横扫语言领域。

来自主题: AI技术研报

9170 点击 2025-05-18 14:28

中国科学院计算所：从 NFS 到 JuiceFS，大模型训推平台存储演进之路

经过对多种开源存储系统的评估对比，我们选择了 JuiceFS 。我们的架构采用 Redis 进行高性能元数据管理，同时构建了自有 MinIO 集群作为底层对象存储，这一架构完美解决了模型训练场景中的数据读写瓶颈、元数据访问延迟以及计算资源之间的存储互通问题。

来自主题: AI技术研报

8108 点击 2025-05-18 10:29

AI怎样模仿人类大脑的注意力机制？

最近，人们对AI谈得最多的是deepseek（简称DS）。这匹来自中国本土的黑马，闯入全球视野，一度扰乱美国股市，在 AI 领域掀起了一场轩然大波。

来自主题: AI技术研报

10309 点击 2025-05-17 18:15

谢赛宁等推出统一多模态模型！替代VAE实现图像理解/生成双SOTA，代码权重数据集全开源

统一图像理解和生成，还实现了新SOTA。

来自主题: AI技术研报

10012 点击 2025-05-17 16:35

苦研10年无果，千万经费打水漂！AI黑箱依然无解，谷歌撕破脸

ChatGPT「舔狗化」事件背后，暴漏目前AI仍是「黑箱」。一场关于「机制可解释性」的路线分歧，正撕裂AI研究最核心的价值共识。谷歌认怂，Anthropic死磕——AI还能被「看懂」吗？

来自主题: AI技术研报

7733 点击 2025-05-17 16:28

带图推理碾压同类开源模型！港中文微软等开源OpenThinkIMG框架，教AI学会使用视觉工具

教AI学会使用工具，带图推理就能变得更强？！

来自主题: AI技术研报

8004 点击 2025-05-17 16:03

通义实验室新研究：大模型自己「扮演」搜索引擎，提升推理能力无需搜索API

强化学习（RL）+真实搜索引擎，可以有效提升大模型检索-推理能力。

来自主题: AI技术研报

9066 点击 2025-05-17 15:41

ICML 2025 Spotlight｜南洋理工陶大程教授团队等提出基于RAG的高分辨率图像感知框架，准确率提高20%

该工作由南洋理工大学陶大程教授团队与武汉大学罗勇教授、杜博教授团队等合作完成。

来自主题: AI技术研报

8808 点击 2025-05-17 15:18

泛化性暴涨47%！首个意图检测奖励范式，AI工具爆炸时代意图识别新解法

近日，腾讯 PCG 社交线的研究团队针对这一问题，采用强化学习（RL）训练方法，通过分组相对策略优化（Group Relative Policy Optimization, GRPO）算法，结合基于奖励的课程采样策略（Reward-based Curriculum Sampling, RCS），将其创新性地应用在意图识别任务上，

来自主题: AI技术研报

7573 点击 2025-05-16 15:25