AI技术研报-这里有最前沿的人工智能技术解读

Llama 3.1横空出世！开源巨无霸首次击溃闭源，全民GPT-4时代来临

大模型格局，再次一夜变天。Llama 3.1 405B重磅登场，在多项测试中一举超越GPT-4o和Claude 3.5 Sonnet。史上首次，开源模型击败当今最强闭源模型。小扎大胆豪言：开源AI必将胜出，就如Linux最终取得了胜利。

来自主题: AI技术研报

9676 点击 2024-07-24 21:04

清华领衔发布多模态评估MultiTrust：GPT-4可信度有几何？

以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应用领域，掀起了一场技术革命。

来自主题: AI技术研报

9742 点击 2024-07-24 17:03

从裸机到700亿参数大模型，这里有份教程，还有现成可用的脚本

我们知道 LLM 是在大规模计算机集群上使用海量数据训练得到的，机器之心曾介绍过不少用于辅助和改进 LLM 训练流程的方法和技术。而今天，我们要分享的是一篇深入技术底层的文章，介绍如何将一堆连操作系统也没有的「裸机」变成用于训练 LLM 的计算机集群。

来自主题: AI技术研报

9903 点击 2024-07-24 16:57

Nature重磅：AI击败最先进全球传统天气、气候模型，30秒生成22.8天大气模拟，准确预测40年全球变暖趋势

传统天气预测、气候模拟，正被 AI 颠覆

来自主题: AI技术研报

11016 点击 2024-07-23 19:33

大模型风向变了，OpenAI苹果掉头布阵

大模型迈入“小而强”时代。

来自主题: AI技术研报

11037 点击 2024-07-23 19:31

ECCV 2024｜盲视频去闪烁通用方法BlazeBVD来了，美图&国科大联合提出

近年，短视频生态的赛道迅猛崛起，围绕短视频而生的创作编辑工具在不断涌现，美图公司旗下专业手机视频编辑工具 ——Wink，凭借独创的视频画质修复能力独占鳌头，海内外用户量持续攀升。

来自主题: AI技术研报

4781 点击 2024-07-23 16:43

无限生成视频，还能规划决策，扩散强制整合下一token预测与全序列扩散

近日，MIT CSAIL 的一个研究团队（一作为 MIT 在读博士陈博远）成功地将全序列扩散模型与下一 token 模型的强大能力统合到了一起，提出了一种训练和采样范式：Diffusion Forcing（DF）。

来自主题: AI技术研报

5205 点击 2024-07-23 16:40

真相了！大模型解数学题和人类真不一样：死记硬背、知识欠缺明显，GPT-4o表现最佳

随着人工智能技术的快速发展，能够处理多种模态信息的多模态大模型（LMMs）逐渐成为研究的热点。通过整合不同模态的信息，LMMs 展现出一定的推理和理解能力，在诸如视觉问答、图像生成、跨模态检索等任务中表现出色。

来自主题: AI技术研报

11176 点击 2024-07-23 16:34

首个超越GPT4o级开源模型！Llama 3.1泄密：4050亿参数，下载链接、模型卡都有了

Llama 3.1 终于现身了，不过出处却不是 Meta 官方。

来自主题: AI技术研报

5906 点击 2024-07-23 16:15

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星

不用H100，三台苹果电脑就能带动400B大模型。背后的功臣，是GitHub上的一个开源分布式AI推理框架，已经斩获了2.5k星标。

来自主题: AI技术研报

8776 点击 2024-07-23 00:26

“具身智能小镇”来了！机器人逛超市买菜满街跑，AI充当NPC，来自上海AI Lab

超逼真的机器人小镇来了！在这里，机器人可以像人一样在超市里购物

来自主题: AI技术研报

8474 点击 2024-07-23 00:23

挑战Scaling Law，Meta发布移动端350M小模型MobileLLM，性能比肩7B LLaMA-v2

Scaling Law还没走到尽头，「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列，规模甚至降低到了1B以下，两个版本分别只有125M和350M参数，但却实现了比更大规模模型更优的性能。

来自主题: AI技术研报

10515 点击 2024-07-22 15:25

ECCV 2024 | 提升GPT-4V、Gemini检测任务性能，你需要这种提示范式

多模态大模型（Multimodal Large Language Models，MLLMs）在不同的任务中表现出了令人印象深刻的能力，尽管如此，这些模型在检测任务中的潜力仍被低估。

来自主题: AI技术研报

11282 点击 2024-07-22 14:58

中科大联合华为诺亚提出Entropy Law，揭秘大模型性能、数据压缩率以及训练损失关系

数据是大语言模型（LLMs）成功的基石，但并非所有数据都有益于模型学习。

来自主题: AI技术研报

10216 点击 2024-07-22 14:55

从空间智能到具身智能，跨维践行Sim2Real AI最高效路径

具身智能狂潮降临的一年多里，物理世界与信息的生产与交互方式发生着革命性变化。

来自主题: AI技术研报

12489 点击 2024-07-22 14:47

AI视频修复速度10倍提升，过曝变色也能逐帧搞定｜美图国科大新算法

家人们，消除“视频闪烁”（比如画面突然一白）有新招了！

来自主题: AI技术研报

11554 点击 2024-07-21 17:16

ECCV 2024 | 让GPT-4图像理解更易出错，全新策略增强VLP模型对抗迁移性

针对视觉-语言预训练（Vision-Language Pretraining, VLP）模型的对抗攻击，现有的研究往往仅关注对抗轨迹中对抗样本周围的多样性，但这些对抗样本高度依赖于代理模型生成，存在代理模型过拟合的风险。

来自主题: AI技术研报

10539 点击 2024-07-21 17:12

在机器人顶会 RSS 2024 上，中国的人形机器人研究斩获最佳论文奖

近日，机器人领域著名会议 RSS（Robotics: Science and Systems） 2024 在荷兰代尔夫特理工大学圆满落幕。

来自主题: AI技术研报

9267 点击 2024-07-21 17:07

打破生态孤岛，国产异构原生AI算力工具问世，来自中科加禾

「通过系统优化软件的帮助，开发的门槛会被降低，各种不同硬件会得到统一，让技术生态得到发展。

来自主题: AI技术研报

9373 点击 2024-07-21 17:03

前谷歌科学家Yi Tay「LLM演义」系列博客第一弹：BERT为何匿迹江湖？

前谷歌科学家Yi Tay重磅推出「LLM时代的模型架构」系列博客，首篇博文的话题关于：基于encoder-only架构的BERT是如何被基于encoder-decoder架构的T5所取代的，分析了BERT灭绝的始末以及不同架构模型的优缺点，以史为鉴，对于未来的创新具有重要意义。

来自主题: AI技术研报

10744 点击 2024-07-21 16:58

斯坦福博士图解AlphaFold 3：超多细节+可视化还原ML工程师眼中的AF3

AlphaFold 3的论文太晦涩？没关系，斯坦福大学的两位博士生「图解」AlphaFold 3 ，将模型架构可视化，同时不遗漏任何一个细节。

来自主题: AI技术研报

10139 点击 2024-07-21 16:53

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mistral 7B全开源

小模型时代来了？OpenAI带着GPT-4o mini首次入局小模型战场，Mistral AI、HuggingFace本周接连发布了小模型。如今，苹果也发布了70亿参数小模型DCLM，性能碾压Mistral-7B。

来自主题: AI技术研报

9903 点击 2024-07-21 16:46

KDD 2024｜港大黄超团队深度解析大模型在图机器学习领域的「未知边界」

在信息爆炸的当今时代，我们如何从浩如烟海的数据中探寻深层次的联系呢？

来自主题: AI技术研报

10631 点击 2024-07-21 14:21

权重、代码、数据集全开源，性能超越Mistral-7B，苹果小模型来了

小模型成趋势？

来自主题: AI技术研报

10890 点击 2024-07-21 14:19

机器人版的「斯坦福小镇」来了，专为具身智能研究打造

首个专为各种机器人设计的模拟互动 3D 社会。

来自主题: AI技术研报

10793 点击 2024-07-21 14:17

使用视觉语言模型进行 PDF 检索 [译]

近年来，随着大语言模型 (LLM) 的发展，构建检索增强生成 (RAG) 解决方案成为了一个热门话题。RAG 将 LLM 的强大功能与检索模型结合，应用于专有知识数据库。然而，对于开发人员来说，一个主要挑战是将各种文档格式（如 PDF、HTML 等）转换为可供文本模型处理的格式。

来自主题: AI技术研报

10156 点击 2024-07-21 14:12

LoRA综述来了! 浙大《大语言模型的LoRA研究》综述

低秩适应（Low-Rank Adaptation，LoRA）通过可插拔的低秩矩阵更新密集神经网络层，是当前参数高效微调范式中表现最佳的方法之一。此外，它在跨任务泛化和隐私保护方面具有显著优势。

来自主题: AI技术研报

12014 点击 2024-07-21 14:02

英伟达Mistral AI联袂出击！120亿小模型王者强势登场，碾压Llama 3单张4090可跑

GPT-4o mini头把交椅还未坐热，Mistral AI联手英伟达发布12B参数小模型Mistral Nemo，性能赶超Gemma 2 9B和Llama 3 8B。

来自主题: AI技术研报

7741 点击 2024-07-21 00:16

大模型“自学”后能力反下降，Llama/Mistral都没逃过

AI经过多轮“自我提升”，能力不增反降？

来自主题: AI技术研报

8992 点击 2024-07-19 17:04

从LLM到AI Agent，从Workflow到Agentic Workflow，25篇论文全面了解智能体工作流

著名AI学者、斯坦福大学教授吴恩达提出了AI Agent的四种设计方式后，Agentic Workflow（智能体工作流）立即火爆全球，多个行业都在实践智能体工作流的应用，并推动了新的Agentic AI探索热潮。

来自主题: AI技术研报

10522 点击 2024-07-19 16:34

AI技术研报-这里有最前沿的人工智能技术解读

Llama 3.1横空出世！开源巨无霸首次击溃闭源，全民GPT-4时代来临

清华领衔发布多模态评估MultiTrust：GPT-4可信度有几何？

从裸机到700亿参数大模型，这里有份教程，还有现成可用的脚本

Nature重磅：AI击败最先进全球传统天气、气候模型，30秒生成22.8天大气模拟，准确预测40年全球变暖趋势

大模型风向变了，OpenAI苹果掉头布阵

ECCV 2024｜盲视频去闪烁通用方法BlazeBVD来了，美图&国科大联合提出

无限生成视频，还能规划决策，扩散强制整合下一token预测与全序列扩散

真相了！大模型解数学题和人类真不一样：死记硬背、知识欠缺明显，GPT-4o表现最佳

首个超越GPT4o级开源模型！Llama 3.1泄密：4050亿参数，下载链接、模型卡都有了

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星​

“具身智能小镇”来了！机器人逛超市买菜满街跑，AI充当NPC，来自上海AI Lab

挑战Scaling Law，Meta发布移动端350M小模型MobileLLM，性能比肩7B LLaMA-v2

ECCV 2024 | 提升GPT-4V、Gemini检测任务性能，你需要这种提示范式

中科大联合华为诺亚提出Entropy Law，揭秘大模型性能、数据压缩率以及训练损失关系

从空间智能到具身智能，跨维践行Sim2Real AI最高效路径

AI视频修复速度10倍提升，过曝变色也能逐帧搞定｜美图国科大新算法

ECCV 2024 | 让GPT-4图像理解更易出错，全新策略增强VLP模型对抗迁移性

在机器人顶会 RSS 2024 上，中国的人形机器人研究斩获最佳论文奖

打破生态孤岛，国产异构原生AI算力工具问世，来自中科加禾

前谷歌科学家Yi Tay「LLM演义」系列博客第一弹：BERT为何匿迹江湖？

斯坦福博士图解AlphaFold 3：超多细节+可视化还原ML工程师眼中的AF3

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mistral 7B全开源

KDD 2024｜港大黄超团队深度解析大模型在图机器学习领域的「未知边界」

权重、代码、数据集全开源，性能超越Mistral-7B，苹果小模型来了

机器人版的「斯坦福小镇」来了，专为具身智能研究打造

使用视觉语言模型进行 PDF 检索 [译]

LoRA综述来了! 浙大《大语言模型的LoRA研究》综述

英伟达Mistral AI联袂出击！120亿小模型王者强势登场，碾压Llama 3单张4090可跑

大模型“自学”后能力反下降，Llama/Mistral都没逃过

从LLM到AI Agent，从Workflow到Agentic Workflow，25篇论文全面了解智能体工作流

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星