AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
ICML 2025 Spotlight | 用傅里叶分解探讨图像对抗扰动,代码已开源

ICML 2025 Spotlight | 用傅里叶分解探讨图像对抗扰动,代码已开源

ICML 2025 Spotlight | 用傅里叶分解探讨图像对抗扰动,代码已开源

本文作者分别来自中国科学院大学和中国科学院计算技术研究所。第一作者裴高政为中国科学院大学博士二年级学生,本工作共同通讯作者是中国科学院大学马坷副教授和黄庆明教授。

来自主题: AI技术研报
8262 点击    2025-05-18 14:47
ICML 2025|如何凭「自动补全」实现100K生成3×加速?

ICML 2025|如何凭「自动补全」实现100K生成3×加速?

ICML 2025|如何凭「自动补全」实现100K生成3×加速?

在当前大模型推理愈发复杂的时代,如何快速、高效地产生超长文本,成为了模型部署与优化中的一大核心挑战。

来自主题: AI技术研报
7414 点击    2025-05-18 14:38
图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

自回归(AR)范式凭借将语言转化为离散 token 的核心技术,在大语言模型领域大获成功 —— 从 GPT-3 到 GPT-4o,「next-token prediction」以简单粗暴的因果建模横扫语言领域。

来自主题: AI技术研报
7286 点击    2025-05-18 14:28
中国科学院计算所:从 NFS 到 JuiceFS,大模型训推平台存储演进之路

中国科学院计算所:从 NFS 到 JuiceFS,大模型训推平台存储演进之路

中国科学院计算所:从 NFS 到 JuiceFS,大模型训推平台存储演进之路

经过对多种开源存储系统的评估对比,我们选择了 JuiceFS 。我们的架构采用 Redis 进行高性能元数据管理,同时构建了自有 MinIO 集群作为底层对象存储,这一架构完美解决了模型训练场景中的数据读写瓶颈、元数据访问延迟以及计算资源之间的存储互通问题。

来自主题: AI技术研报
6723 点击    2025-05-18 10:29
AI怎样模仿人类大脑的注意力机制?

AI怎样模仿人类大脑的注意力机制?

AI怎样模仿人类大脑的注意力机制?

最近,人们对AI谈得最多的是deepseek(简称DS)。这匹来自中国本土的黑马,闯入全球视野,一度扰乱美国股市,在 AI 领域掀起了一场轩然大波。

来自主题: AI技术研报
8013 点击    2025-05-17 18:15
苦研10年无果,千万经费打水漂!AI黑箱依然无解,谷歌撕破脸

苦研10年无果,千万经费打水漂!AI黑箱依然无解,谷歌撕破脸

苦研10年无果,千万经费打水漂!AI黑箱依然无解,谷歌撕破脸

ChatGPT「舔狗化」事件背后,暴漏目前AI仍是「黑箱」。  一场关于「机制可解释性」的路线分歧,正撕裂AI研究最核心的价值共识。谷歌认怂,Anthropic死磕——AI还能被「看懂」吗?

来自主题: AI技术研报
6335 点击    2025-05-17 16:28