AI资讯新闻榜单内容搜索-大模型

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

无情戳穿“长上下文”大模型的虚标现象

来自主题: AI技术研报

10492 点击 2024-06-03 15:39

超越Devin！姚班带队，他们创大模型编程新世界纪录

超越Devin！SWEBench排行榜上迎来了新玩家

来自主题: AI资讯

9848 点击 2024-06-03 15:34

多模态大模型+自动驾驶=？ECCV'24这场Workshop开启招募啦

多模态，已经成为大模型最重要的发展方向之一。

来自主题: AI资讯

9944 点击 2024-06-03 11:14

阿里大模型的面子与里子

不卖模型卖算力

来自主题: AI资讯

10223 点击 2024-06-03 10:31

对话Arm终端产品副总裁：当生成式AI与Arm的DNA相契合，会擦出怎样的火花？

生成式AI时代，Arm要做计算“基石”。

来自主题: AI资讯

9298 点击 2024-06-03 10:23

互联网大厂 AI App 大横评：元宝、通义、豆包和文心一言哪家强？

腾讯终于也发布了to C的AI大模型APP——元宝，至此国内的四家大厂的AI大模型APP总算是集齐了。

来自主题: AI资讯

19804 点击 2024-06-02 14:52

高效、可泛化的高斯重建框架，只需3张视图即可快速推理，45秒便可完成优化

3D 重建和新视图合成技术在虚拟现实和增强现实等领域有着广泛的应用。NeRF 通过隐式地将场景编码为辐射场，在视图合成上取得了显著的成功。

来自主题: AI技术研报

9875 点击 2024-06-02 14:46

开源模型进展盘点：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？

深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察，也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中，他盘点分析了 4 月份发布的四个主要新模型：Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。

来自主题: AI技术研报

10719 点击 2024-06-02 14:42

多模态大模型不够灵活，谷歌DeepMind创新架构Zipper：分开训练再「压缩」

最近的一系列研究表明，纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征，从而成功地生成多种模态（如音频、图像或状态 - 动作序列）的新序列，从文本、蛋白质、音频到图像，甚至是状态序列。

来自主题: AI技术研报

9295 点击 2024-06-02 14:38

首次解密Claude 3大脑！25岁Anthropic参谋长预言3年内自己将被AI淘汰

Anthropic的25岁参谋长自曝因为深感AGI，未来三年自己的工作将被AI取代。她在最近的一篇文章中预言了未来即将要被淘汰的工种。难道说，Claude 3模型已经初现AGI了吗？

来自主题: AI技术研报

9158 点击 2024-06-02 14:24