AI技术研报-这里有最前沿的人工智能技术解读

AI作曲缺数据，浙大GTSinger数据集上线：适配所有歌声任务、带有真实乐谱

传统的歌声任务，如歌声合成，大多是在利用输入的歌词和乐谱生成高质量的歌声。随着深度学习的发展，人们希望实现可控和能个性化定制的歌声生成。

来自主题: AI技术研报

8035 点击 2024-10-14 10:38

大模型「强崩溃」！Meta新作：合成数据有「剧毒」，1%即成LLM杀手

1%的合成数据，就让LLM完全崩溃了？ 7月，登上Nature封面一篇论文证实，用合成数据训练模型就相当于「近亲繁殖」，9次迭代后就会让模型原地崩溃。

来自主题: AI技术研报

6266 点击 2024-10-14 10:12

OpenAI今天Open了一下：开源多智能体框架Swarm

毫无疑问，多智能体肯定是 OpenAI 未来重要的研究方向之一，前些天 OpenAI 著名研究科学家 Noam Brown 还在 X 上为 OpenAI 正在组建的一个新的多智能体研究团队招募机器学习工程师。

来自主题: AI技术研报

7676 点击 2024-10-12 15:02

清华校友用AI破解162个高数定理，智能体LeanAgent攻克困扰陶哲轩难题！

诺贝尔物理学奖和化学奖被AI「包圆」后，人们再次确信：基础科学研究的范式，已经被AI从根本上改变。

来自主题: AI技术研报

6384 点击 2024-10-12 14:55

六年、六届学生接力，共铸上交大图像合成工具箱libcom

如果你对 arXiv 的版本号有所了解，你就知道这篇论文已经更新了 4 次，现在已经来到了第 5 个版本。实际上，这个 arXiv 编号属于上海交通大学牛力团队一篇持续更新了四年的综述报告。

来自主题: AI技术研报

6869 点击 2024-10-12 14:51

NeurIPS 2024 | Transformer长度外推，全新位置编码DAPE大幅提升模型性能

在当今的人工智能领域，Transformer 模型已成为解决诸多自然语言处理任务的核心。然而，Transformer 模型在处理长文本时常常遇到性能瓶颈。传统的位置编码方法，如绝对位置编码（APE）和相对位置编码（RPE），虽然在许多任务中表现良好，但其固定性限制了其在处理超长文本时的适应性和灵活性。

来自主题: AI技术研报

8369 点击 2024-10-12 14:29

李飞飞：不要数字孪生，要数字表兄弟，一张照片生成机器人训练场景

不百分百还原出虚拟场景，效果反而更好。

来自主题: AI技术研报

8094 点击 2024-10-12 14:22

米开朗基罗怎么说？谷歌DeepMind推出长上下文评估新框架

近日，来自谷歌DeepMind的研究人员提出了Michelangelo，「用米开朗基罗的观点」来测量任意上下文长度的基础模型性能。

来自主题: AI技术研报

5201 点击 2024-10-12 11:07

NeurIPS 2024 | 大模型的词表大小，同样适用于Scaling Law

本文是一篇发表在 NeurIPS 2024 上的论文，单位是香港大学、Sea AI Lab、Contextual AI 和俄亥俄州立大学。论文主要探讨了大型语言模型（LLMs）的词表大小对模型性能的影响。

来自主题: AI技术研报

8163 点击 2024-10-11 13:55

苏姿丰2小时激情演讲！发布AMD最强AI芯片，旗舰CPU单颗10万，OpenAI微软都来站台

猛，实在是猛！就在今日，老牌芯片巨头AMD交出了一份令人印象深刻的AI答卷。

来自主题: AI技术研报

8484 点击 2024-10-11 11:37

首个AI Kaggle特级大师诞生，o1夺7金封王！OpenAI放出AGI大招：L3级智能体明年要来？

OpenAI即将要兑现L3级智能体承诺了！MLE-bench新基准汇聚75个Kaggle竞赛，o1首测便拿下7金，多次尝试性能还能飙升17%，堪称首个AI Kaggle特级大师。

来自主题: AI技术研报

8084 点击 2024-10-11 11:14

诺贝尔文学奖要颁给ChatGPT？奥特曼得奖呼声高，Hinton怒斥：他不配！

本届诺奖的AI含量，实在是过高了！今晚的文学奖会颁给ChatGPT或者奥特曼吗？已经有一大波网友下注了。另一边，Hinton已经炮轰起了奥特曼，力挺Ilya当初赶走他；而LSTM之父则怒斥Hinton不配诺奖。

来自主题: AI技术研报

8926 点击 2024-10-10 19:02

NeurIPS 2024｜SparseLLM：突破性全局剪枝技术，大语言模型稀疏化革命

该研究主要探讨了大语言模型的全局剪枝方法，旨在提高预训练语言模型的效率。该成果的发表为大模型的剪枝与优化研究提供了新的视角，并在相关领域具有重要的应用潜力。

来自主题: AI技术研报

6364 点击 2024-10-10 17:17

清华微软最新力作：用物理学革新Transformer注意力，「大海捞针」精度暴涨30%！

随着诺贝尔物理学奖颁给了「机器学习之父」Geoffrey Hinton，另一个借鉴物理学概念的模型架构也横空出世——微软清华团队的最新架构Differential Transformer，从注意力模块入手，实现了Transformer的核心能力提升。

来自主题: AI技术研报

9366 点击 2024-10-10 14:24

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

随着大规模语言模型的快速发展，如 GPT、Claude 等，LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而，即便如此，LLM 仍然存在生成不当或偏离预期的结果。这种现象在推理过程中尤为突出，常常导致不准确、不符合语境或不合伦理的回答。为了解决这一问题，学术界和工业界提出了一系列对齐（Alignment）技术，旨在优化模型的输出，使其更加符合人类的价值观和期望。

来自主题: AI技术研报

9966 点击 2024-10-10 12:21