AI资讯新闻榜单内容搜索-ICML

ICML 2025 | 清华、上海AI Lab等提出傅里叶位置编码，多项任务远超RoPE

长文本能力对语言模型（LM，Language Model）尤为重要，试想，如果 LM 可以处理无限长度的输入文本，我们可以预先把所有参考资料都喂给 LM，或许 LM 在应对人类的提问时就会变得无所不能。

来自主题: AI技术研报

8801 点击 2025-05-09 10:42

ICML 2025 | 视频生成模型无损加速两倍，秘诀竟然是「抓住attention的时空稀疏性」

自 OpenAI 发布 Sora 以来，AI 视频生成技术进入快速爆发阶段。凭借扩散模型强大的生成能力，我们已经可以看到接近现实的视频生成效果。但在模型逼真度不断提升的同时，速度瓶颈却成为横亘在大规模应用道路上的最大障碍。

来自主题: AI技术研报

9033 点击 2025-05-08 10:15

机器人界「Sora」来了！清华、星动纪元开源首个AIGC机器人大模型，入选ICML2025 Spotlight

从 2023 年的 Sora 到如今的可灵、Vidu、通义万相，AIGC 生成式技术的魔法席卷全球，打开了 AI 应用落地的大门。

来自主题: AI技术研报

10572 点击 2025-05-07 17:40

ICML 2025 Spotlight｜华为诺亚提出端侧大模型新架构MoLE，内存搬运代价降低1000倍

Mixture-of-Experts（MoE）在推理时仅激活每个 token 所需的一小部分专家，凭借其稀疏激活的特点，已成为当前 LLM 中的主流架构。然而，MoE 虽然显著降低了推理时的计算量，但整体参数规模依然大于同等性能的 Dense 模型，因此在显存资源极为受限的端侧部署场景中，仍然面临较大挑战。

来自主题: AI技术研报

7121 点击 2025-05-07 09:30

ICML 2025 | 注意力机制中的极大值：破解大语言模型上下文理解的关键

大型语言模型（LLMs）在上下文知识理解方面取得了令人瞩目的成功。

来自主题: AI技术研报

7832 点击 2025-05-06 14:52

大模型边推理边纠错，有可能做到吗？这是ICML爆火的演讲

即便是最强大的语言模型（LLM），仍会偶尔出现推理错误。除了通过提示词让模型进行不太可靠的多轮自我纠错外，有没有更系统的方法解决这一问题呢？

来自主题: AI资讯

10041 点击 2024-09-08 15:57

顶会审稿人紧缺，我审我自己！ICML 2023排序实验结果出炉：作者自评能提升评审质量吗？

宾夕法尼亚大学苏炜杰教授团队在ICML 2023会议中进行实验显示，经过作者自评校准后，审稿分数的误差降低超过20%。

来自主题: AI资讯

10515 点击 2024-09-08 15:41

大模型对语言有自己的理解！MIT论文揭示大模型“思维过程” | ICML 24

大模型对现实世界，可以形成自己的理解！

来自主题: AI资讯

6782 点击 2024-08-17 14:02

最高提速1440倍！15秒用GCN搞定随机规划，中科院自动化所新成果入选ICML 24

仅需15秒即可搞定随机规划问题，速度比传统方法快了1440倍！

来自主题: AI技术研报

7944 点击 2024-08-10 19:00

ICML 2024 | 人物交互图像，现在更懂你的提示词了，北大推出基于语义感知的人物交互图像生成框架

该论文的第一作者和通讯作者均来自北京大学王选计算机研究所的 MIPL实验室，第一作者为博士生徐铸，通讯作者为博士生导师刘洋。MIPL 实验室近年来在 IJCV、CVPR、AAAI、ICCV、ICML、ECCV 等顶会上有多项代表性成果发表，多次荣获国内外 CV 领域重量级竞赛的冠军奖项，和国内外知名高校、科研机构广泛开展合作。

来自主题: AI技术研报

5508 点击 2024-08-08 18:44