AI技术研报-这里有最前沿的人工智能技术解读

Bengio等人新作：注意力可被视为RNN，新模型媲美Transformer，但超级省内存

既能像 Transformer 一样并行训练，推理时内存需求又不随 token 数线性递增，长上下文又有新思路了？

来自主题: AI技术研报

8064 点击 2024-05-25 18:07

AI黑盒研究的突破性进展：Anthropic详解大模型的「思维」特征

一直以来 AI 都是一个黑盒子（black box），其内部运作机制是不可见的。人们输入数据并得到结果，但无法检查输出结果的逻辑或者系统的代码。而就在刚刚，Anthropic 宣布在理解人工智能模型内部运作机制方面取得重大进展。

来自主题: AI技术研报

6767 点击 2024-05-25 17:21

从玻尔兹曼机到多模态大模型：Geoffrey Hinton的最新AI洞见

在人工智能的辉煌历史中，Geoffrey Hinton教授不仅是深度学习的奠基人之一，更是推动了整个领域从理论到实践的转变。在这次深入的访谈中，Geoffrey Hinton分享了自己在人工智能研究中的个人经历、对深度学习未来发展的深刻见解，以及对当前技术可能带来的社会影响的深思熟虑。

来自主题: AI技术研报

3016 点击 2024-05-25 10:44

独家！哈佛博士后押注，骨科AI+机器人赛道火了

关节置换手术被称为骨科的“世纪手术”。

来自主题: AI技术研报

9399 点击 2024-05-25 10:31

腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

以 OpenAI 的 GPT 系列模型为代表的大语言模型（LLM）掀起了新一轮 AI 应用浪潮，但是 LLM 推理的高昂成本一直困扰着业务团队。

来自主题: AI技术研报

10781 点击 2024-05-24 20:58

从80个模型中构建Scaling Law：华人博士生新作，思维链提出者力荐

在 AI 领域，扩展定律（Scaling laws）是理解 LM 扩展趋势的强大工具，其为广大研究者提供了一个准则，该定律在理解语言模型的性能如何随规模变化提供了一个重要指导。

来自主题: AI技术研报

5367 点击 2024-05-24 20:52

标注受限也能识别多标签图像！中山大学等发布异构语义转移HST框架 | IJCV 2024

在多标签图像识别领域中，由于图像本身和潜在标签类别的复杂性，收集满足现有模型训练的多标签标注信息往往成本高昂且难以拓展。中山大学联合广东工业大学联手探索标注受限情况下的多标签图像识别任务，通过对多标签图像中的强语义相关性的探索研究，提出了一种异构语义转移(Heterogeneous Semantic Transfer, HST) 框架，实现了有效的未知标签生成。

来自主题: AI技术研报

4957 点击 2024-05-24 20:39

利润暴涨628%，AI霸主英伟达全产业链投资图鉴｜智氪

5月22日，全球资本市场的“大网红”英伟达发布了2025财年第一财季（截至2024年4月28日）的报告。

来自主题: AI技术研报

5735 点击 2024-05-24 12:43

世界模型也扩散！训练出的智能体竟然不错

在图像生成领域占据主导地位的扩散模型，开始挑战强化学习智能体。

来自主题: AI技术研报

10616 点击 2024-05-24 11:22

大模型降价，一场没有赢家的战争

本文讨论了大模型厂商的降价现象，并分析了其背后的技术和商业动机。

来自主题: AI技术研报

5010 点击 2024-05-23 13:50

简单通用：视觉基础网络最高3倍无损训练加速，清华EfficientTrain++入选TPAMI 2024

近年来，「scaling」是计算机视觉研究的主角之一。随着模型尺寸和训练数据规模的增大、学习算法的进步以及正则化和数据增强等技术的广泛应用，通过大规模训练得到的视觉基础网络（如 ImageNet1K/22K 上训得的 Vision Transformer、MAE、DINOv2 等）已在视觉识别、目标检测、语义分割等诸多重要视觉任务上取得了令人惊艳的性能。

来自主题: AI技术研报

10071 点击 2024-05-22 13:33

AI服务器爆火，这些芯片赛道进入狂欢期

AI服务器与传统服务器相比，究竟有何独特之处？在当今社会，人工智能的应用场景愈发广泛，如小爱同学、天猫精灵等AI服务已深入人们的生活。随着人工智能时代的来临，AI服务器也开始在社会各行业发挥重要作用。那么，AI服务器与传统服务器相比，究竟有何独特之处？为何AI服务器能在人工智能时代中逐渐取代普通服务器，成为主流呢？

来自主题: AI技术研报

7712 点击 2024-05-22 13:33