AI资讯新闻榜单内容搜索-训练

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构建多模态基准

LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。

来自主题: AI技术研报

10162 点击 2024-08-08 14:41

无比喻，不论文！用「画家流水线」的方式理解Transformer中间层

Transformer架构层层堆叠，包含十几亿甚至几十亿个参数，这些层到底是如何工作的？当一个新奇的比喻——「画家流水线」，被用于类比并理解Transformer架构的中间层，情况突然变得明朗起来，并引出了一些有趣的发现。

来自主题: AI技术研报

11286 点击 2024-08-08 14:37

三「模」联盟，谷歌DeepMind缔造终身学习智能体！

打造终身学习智能体，是研究界以来一直追求的目标。最近，帝国理工联手谷歌DeepMind打造了创新联合框架扩散增强智能体（DAAG），利用LLM+VLM+DM三大模型，让AI完成迁移学习、高效探索。

来自主题: AI资讯

4244 点击 2024-08-07 19:06

无一大模型及格！北大/通研院提出超难基准，专门评估长文本理解生成

在长文本理解能力这块，竟然没有一个大模型及格！

来自主题: AI技术研报

10602 点击 2024-08-07 14:58

八问八答搞懂Transformer内部运作原理

七年前，论文《Attention is all you need》提出了 transformer 架构，颠覆了整个深度学习领域。

来自主题: AI技术研报

10081 点击 2024-08-07 14:31

李飞飞「空间智能」之后，上交、智源、北大等提出空间大模型SpatialBot

李飞飞老师提出了空间智能 (Spatial Intelligence) 这一概念，作为回应，来自上交、斯坦福、智源、北大、牛津、东大的研究者提出了空间大模型 SpatialBot，并提出了训练数据 SpatialQA 和测试榜单 SpatialBench，尝试让多模态大模型在通用场景和具身场景下理解深度、理解空间。

来自主题: AI技术研报

11362 点击 2024-08-07 14:12

错误率从10%降至0.01%，领英全面分享LLM应用落地经验

随着大型语言模型（LLM）技术日渐成熟，各行各业加快了 LLM 应用落地的步伐。为了改进 LLM 的实际应用效果，业界做出了诸多努力。

来自主题: AI资讯

6919 点击 2024-08-07 11:24

ACL 2024 Oral | 大模型也会被忽悠？揭秘AI的信念之旅

地球是平的吗？当然不是。自古希腊数学家毕达哥拉斯首次提出地圆说以来，现代科学技术已经证明了地球是圆形这一事实。但是，你有没有想过，如果 AI 被误导性信息 “忽悠” 了，会发生什么？来自清华、上海交大、斯坦福和南洋理工的研究人员在最新的论文中深入探索 LLMs 在虚假信息干扰情况下的表现，他们发现大语言模型在误导信息反复劝说下，非常自信地做出「地球是平的」这一判断。

来自主题: AI资讯

3793 点击 2024-08-07 11:20

AI画家的「滑铁卢」：为什么冰可乐不愿意住进茶杯里？

大模型为何在生成「茶杯中的冰可乐」上失败了？上海交通大学最新揭秘。

来自主题: AI资讯

10964 点击 2024-08-07 10:52

英伟达被曝「偷」数据，每天爬取超 80 年视频数据量，北大学术数据集也遭殃

最近的英伟达似乎步入了多事之秋。

来自主题: AI技术研报

9148 点击 2024-08-07 10:48

AI资讯新闻榜单内容搜索-训练

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构建多模态基准

无比喻，不论文！用「画家流水线」的方式理解Transformer中间层

三「模」联盟，谷歌DeepMind缔造终身学习智能体！

无一大模型及格！ 北大/通研院提出超难基准，专门评估长文本理解生成

八问八答搞懂Transformer内部运作原理

李飞飞「空间智能」之后，上交、智源、北大等提出空间大模型SpatialBot

错误率从10%降至0.01%，领英全面分享LLM应用落地经验

ACL 2024 Oral | 大模型也会被忽悠？揭秘AI的信念之旅

AI画家的「滑铁卢」：为什么冰可乐不愿意住进茶杯里？

英伟达被曝「偷」数据，每天爬取超 80 年视频数据量，北大学术数据集也遭殃

无一大模型及格！北大/通研院提出超难基准，专门评估长文本理解生成