AI资讯新闻榜单内容搜索-模型

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

无情戳穿“长上下文”大模型的虚标现象

来自主题: AI技术研报

10527 点击 2024-06-03 15:39

超越Devin！姚班带队，他们创大模型编程新世界纪录

超越Devin！SWEBench排行榜上迎来了新玩家

来自主题: AI资讯

9877 点击 2024-06-03 15:34

多模态大模型+自动驾驶=？ECCV'24这场Workshop开启招募啦

多模态，已经成为大模型最重要的发展方向之一。

来自主题: AI资讯

9986 点击 2024-06-03 11:14

next-token被淘汰！Meta实测「多token」训练方法，推理提速3倍，性能大涨10%+

研究人员提出了一种新的大型语言模型训练方法，通过一次性预测多个未来tokens来提高样本效率和模型性能，在代码和自然语言生成任务上均表现出显著优势，且不会增加训练时间，推理速度还能提升至三倍。

来自主题: AI技术研报

9716 点击 2024-06-03 11:00

LLM的「母语」是什么？

在以英语为主的语料库上训练的多语言LLM，是否使用英语作为内部语言？对此，来自EPFL的研究人员针对Llama 2家族进行了一系列实验。

来自主题: AI技术研报

10380 点击 2024-06-03 10:53

阿里大模型的面子与里子

不卖模型卖算力

来自主题: AI资讯

10263 点击 2024-06-03 10:31

对话Arm终端产品副总裁：当生成式AI与Arm的DNA相契合，会擦出怎样的火花？

生成式AI时代，Arm要做计算“基石”。

来自主题: AI资讯

9319 点击 2024-06-03 10:23

互联网大厂 AI App 大横评：元宝、通义、豆包和文心一言哪家强？

腾讯终于也发布了to C的AI大模型APP——元宝，至此国内的四家大厂的AI大模型APP总算是集齐了。

来自主题: AI资讯

19913 点击 2024-06-02 14:52

高效、可泛化的高斯重建框架，只需3张视图即可快速推理，45秒便可完成优化

3D 重建和新视图合成技术在虚拟现实和增强现实等领域有着广泛的应用。NeRF 通过隐式地将场景编码为辐射场，在视图合成上取得了显著的成功。

来自主题: AI技术研报

9895 点击 2024-06-02 14:46

开源模型进展盘点：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？

深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察，也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中，他盘点分析了 4 月份发布的四个主要新模型：Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。

来自主题: AI技术研报

10763 点击 2024-06-02 14:42