AI技术研报-这里有最前沿的人工智能技术解读

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

PolygonGNN是一种新型框架，用于学习包括单一和多重多边形在内的多边形几何体的表征，它通过异质可见图来捕捉多边形内外的空间关系，并利用图神经网络有效处理这些关系，以提高计算效率和泛化能力。该框架在五个数据集上表现出色，证明了其在捕捉多边形几何体有用表征方面的有效性。

来自主题: AI技术研报

5267 点击 2024-08-21 18:27

微软「小而美」系列三连发！视觉小钢炮PK GPT-4o，MoE新秀力压Llama 3.1

微软Phi 3.5系列上新了！mini模型小而更美，MoE模型首次亮相，vision模型专注多模态。

来自主题: AI技术研报

5276 点击 2024-08-21 18:14

当Agent开始自己创造自己，AI产品爆发还会是遥远的梦吗？

2024年，AI 领域中最炙手可热的话题无疑是Agent。

来自主题: AI技术研报

8144 点击 2024-08-21 15:05

锚定效应与AI：智能算法如何应对认知偏差

随着人工智能技术的广泛应用，人们认为AI可以避免人类常见的认知偏差。然而，AI本身可能会表现出类似于人类的偏差，例如锚定效应。本文通过回顾“系统1”和“系统2”两个思维模式，探讨AI在这两种模式中的运作方式，分析AI产生认知偏差的原因，并通过具体实验展示AI在面对锚定效应时的表现。本文进一步探讨如何在理解这些局限性的基础上，合理利用AI来改善人类决策质量，并强调AI透明性和可解释性的重要性。

来自主题: AI技术研报

5286 点击 2024-08-21 14:33

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，零污染

随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现出了越来越接近闭源的性能。

来自主题: AI技术研报

10217 点击 2024-08-21 14:28

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。

来自主题: AI技术研报

9300 点击 2024-08-21 14:20

爆火神经网络架构KAN更新2.0！研究者可专属定制，轻松应对经典物理学研究，作者：和MLP不能互相取代

爆火神经网络架构KAN，上新了！

来自主题: AI技术研报

8237 点击 2024-08-21 14:02

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

本期我们邀请到了纽约大学计算机科学院博士童晟邦带来【多模态大模型：视觉为中心的探索】的主题分享。

来自主题: AI技术研报

10547 点击 2024-08-21 10:39

非凡产研：2024年7月全球AIGC行业月报-流量篇

本报告展示及分析了2024年7月全球AI产品的流量态势，通过全球、国内及出海等不同维度进行了详尽的展示。报告涵盖了访问量、下载量、独立访客、APP收入、访问时长以及移动页面占比等核心指标。

来自主题: AI技术研报

6770 点击 2024-08-20 14:51

AI设计自己，代码造物主已来！UBC华人一作首提ADAS，数学能力暴涨25.9%

AI掌握自我设计的权力，将会怎样？最近，来自UBC等机构研究人员提出了「智能体自动化设计」系统，让元智能体使用搜索算法，自动构建强大的同类。

来自主题: AI技术研报

9145 点击 2024-08-20 14:47

浅谈Llama3.1，从结构、训练过程、影响到数据合成

Llama3.1系列模型的开源，真让大模型格局大震，指标上堪比最好的闭源模型比如GPT 4o和Claude3.5，让开源追赶闭源成为现实。

来自主题: AI技术研报

9629 点击 2024-08-20 14:39

浙大李玺团队：指代表达理解新方法，ScanFormer粗到细迭代消除视觉冗余

作为基础的视觉语言任务，指代表达理解（referring expression comprehension, REC）根据自然语言描述来定位图中被指代的目标。REC 模型通常由三部分组成：视觉编码器、文本编码器和跨模态交互，分别用于提取视觉特征、文本特征和跨模态特征特征交互与增强。

来自主题: AI技术研报

5292 点击 2024-08-20 14:36

人工智能驱动的科学研究（AI4S）在药物研发与临床实践中的应用进展

在当今数字化时代，人工智能（artificial intelligence，AI）技术迅猛发展，尤其是生成式技术，如ChatGPT（chat generative pre-trained transformer），对人类生活的影响日益深远。

来自主题: AI技术研报

9440 点击 2024-08-19 17:38

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.0秘诀曝光，智能体生成教学

合成数据2.0秘诀曝光了！来自微软的研究人员们提出了智能体框架AgentInstruct，能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3，在多项基准上刷新了SOTA。

来自主题: AI技术研报

8676 点击 2024-08-19 14:52

Post-Training有多重要？AI2研究员长文详解前沿模型的后训练秘籍

越来越多研究发现，后训练对模型性能同样重要。Allen AI的机器学习研究员Nathan Lambert最近发表了一篇技术博文，总结了科技巨头们所使用的模型后训练配方。

来自主题: AI技术研报

10215 点击 2024-08-19 14:47

机器人策略学习的Game Changer？伯克利提出Body Transformer

过去几年间，Transformer 架构已经取得了巨大的成功，同时其也衍生出了大量变体，比如擅长处理视觉任务的 Vision Transformer（ViT）。本文要介绍的 Body Transformer（BoT）则是非常适合机器人策略学习的 Transformer 变体。

来自主题: AI技术研报

8424 点击 2024-08-19 14:08

横扫16大榜单，最强开源单目深度估计算法来了，精度可以直接用于3D重建｜TPAMI 2024

单目深度估计新成果来了！

来自主题: AI技术研报

5845 点击 2024-08-18 16:51

两个小模型互相验证，直接比肩大模型？微软的rStar甚至没用CoT和微调

互相检查，让小模型也能解决大问题。

来自主题: AI技术研报

8802 点击 2024-08-16 21:12

10人明星团队炼出首个微调Llama 3.1 405B！角色扮演一秒入戏，代码全开源

发布40天后，最强开源模型Llama 3.1 405B等来了微调版本的发布。但不是来自Meta，而是一个专注于开放模型的神秘初创Nous Research。

来自主题: AI技术研报

5854 点击 2024-08-16 14:49

Nature曝惊人内幕：论文被天价卖出喂AI！出版商狂赚上亿，作者0收入

Nature的一篇文章透露：你发过的paper，很可能已经被拿去训练模型了！有的出版商靠卖数据，已经狂赚2300万美元。然而辛辛苦苦码论文的作者们，却拿不到一分钱，这合理吗？

来自主题: AI技术研报

5261 点击 2024-08-16 14:17

大模型指令调优数据集万字评测！腾讯上交大联合出品

随着大模型的快速发展，指令调优在提升模型性能和泛化能力方面发挥着至关重要的作用。

来自主题: AI技术研报

9574 点击 2024-08-15 17:10

清华唐杰团队新作：一口气生成2万字，大模型开卷长输出

一口气生成2万字，大模型输出也卷起来了！

来自主题: AI技术研报

9483 点击 2024-08-15 17:07

Llama 8B搜索100次超越GPT-4o！推理+搜索即可提升性能，新「Scaling Law」诞生？

最近的论文表明，LLM等生成模型可以通过搜索来扩展，并实现非常显著的性能提升。另一个复现实验也发现，让参数量仅8B的Llama 3.1模型搜索100次，即可在Python代码生成任务上达到GPT-4o同等水平。

来自主题: AI技术研报

8591 点击 2024-08-15 16:05

从ACL 2024录用论文看混合专家模型（MoE）最新研究进展

最近ACL 2024 论文放榜，扫了下，SMoE（稀疏混合专家）的论文不算多，这里就仔细梳理一下，包括动机、方法、有趣的发现，方便大家不看论文也能了解的七七八八，剩下只需要感兴趣再看就好。

来自主题: AI技术研报

2724 点击 2024-08-15 10:17

生产力提升30％！微软最大规模调研报告出炉，AI工具成打工人效率神器

AI在现实工作环境中如何影响了工作效率？微软发起一项最大规模的调查研究，AI工具在工作场景中最大提效30％。

来自主题: AI技术研报

9573 点击 2024-08-14 17:02

首个像人类一样思考的网络！Nature子刊：AI模拟人类感知决策

近日，来自佐治亚理工学院的研究人员开发了RTNet，首次表明其「思考方式」与人类非常相似。

来自主题: AI技术研报

9513 点击 2024-08-14 16:45

超级AI即将诞生？史上最强超算9月上线，英伟达最强芯片加持

天网离我们还有多远？现在，科学家们希望通过一个强大的超算网络，来加速发展人类级别的人工智能，预计在2025年前全面投入运行。

来自主题: AI技术研报

8632 点击 2024-08-14 16:40

北大王选所：让多模态大模型更懂人类在做什么｜ECCV 2024

只用提示词，多模态大模型就能更懂场景中的人物关系了。

来自主题: AI技术研报

9358 点击 2024-08-13 16:56

2B多模态新SOTA！华科、华南理工发布Mini-Monkey，专治「切分增大分辨率」后遗症

Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩，证明了其在多模态理解和文档智能领域的潜力。

来自主题: AI技术研报

4356 点击 2024-08-12 17:18

中科大/华为诺亚出手！芯片性能≠布局评分，EDA物理设计框架全面开源

芯片物理布局，有了直指性能指标的新测评标准！

来自主题: AI技术研报

9469 点击 2024-08-12 13:53

AI技术研报-这里有最前沿的人工智能技术解读

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

微软「小而美」系列三连发！视觉小钢炮PK GPT-4o，MoE新秀力压Llama 3.1

当Agent开始自己创造自己，AI产品爆发还会是遥远的梦吗？

锚定效应与AI：智能算法如何应对认知偏差

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，零污染

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

爆火神经网络架构KAN更新2.0！研究者可专属定制，轻松应对经典物理学研究，作者：和MLP不能互相取代

Beidi Chen陈贝迪 独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

非凡产研：2024年7月全球AIGC行业月报-流量篇

AI设计自己，代码造物主已来！UBC华人一作首提ADAS，数学能力暴涨25.9%

浅谈Llama3.1，从结构、训练过程、影响到数据合成

浙大李玺团队：指代表达理解新方法，ScanFormer粗到细迭代消除视觉冗余

人工智能驱动的科学研究（AI4S）在药物研发与临床实践中的应用进展

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.0秘诀曝光，智能体生成教学

Post-Training有多重要？AI2研究员长文详解前沿模型的后训练秘籍

机器人策略学习的Game Changer？伯克利提出Body Transformer

横扫16大榜单，最强开源单目深度估计算法来了，精度可以直接用于3D重建｜TPAMI 2024

两个小模型互相验证，直接比肩大模型？微软的rStar甚至没用CoT和微调

10人明星团队炼出首个微调Llama 3.1 405B！角色扮演一秒入戏，代码全开源

Nature曝惊人内幕：论文被天价卖出喂AI！出版商狂赚上亿，作者0收入

大模型指令调优数据集万字评测！腾讯上交大联合出品

清华唐杰团队新作：一口气生成2万字，大模型开卷长输出

Llama 8B搜索100次超越GPT-4o！推理+搜索即可提升性能，新「Scaling Law」诞生？

从ACL 2024录用论文看混合专家模型（MoE）最新研究进展

生产力提升30％！微软最大规模调研报告出炉，AI工具成打工人效率神器

首个像人类一样思考的网络！Nature子刊：AI模拟人类感知决策

超级AI即将诞生？史上最强超算9月上线，英伟达最强芯片加持

北大王选所：让多模态大模型更懂人类在做什么｜ECCV 2024

2B多模态新SOTA！华科、华南理工发布Mini-Monkey，专治「切分增大分辨率」后遗症

中科大/华为诺亚出手！芯片性能≠布局评分，EDA物理设计框架全面开源

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design