AI技术研报-这里有最前沿的人工智能技术解读

从ACL 2024录用论文看混合专家模型（MoE）最新研究进展

最近 ACL 2024 论文放榜，扫了下，SMoE（稀疏混合专家）的论文不算多，这里就仔细梳理一下，包括动机、方法、有趣的发现，方便大家不看论文也能了解的七七八八，剩下只需要感兴趣再看就好。

来自主题: AI技术研报

11558 点击 2024-08-25 11:48

ECCV 2024 | 机器遗忘之后，扩散模型真正安全了吗？

在人工智能领域，图像生成技术一直是一个备受关注的话题。近年来，扩散模型（Diffusion Model）在生成逼真且复杂的图像方面取得了令人瞩目的进展。然而，技术的发展也引发了潜在的安全隐患，比如生成有害内容和侵犯数据版权。这不仅可能对用户造成困扰，还可能涉及法律和伦理问题。

来自主题: AI技术研报

10730 点击 2024-08-25 11:30

上交大新型SRAM存内计算架构「COMPASS」，开启类脑计算新时代

MICRO 全称 IEEE/ACM International Symposium on Microarchitecture，与 ISCA、HPCA、ASPLOS 并称为体系结构「四大顶会」，囊括了当年最先进的体系结构成果，被视作国际前沿体系结构研究的风向标，见证了诸多突破性成果的首次亮相，包括谷歌、英特尔、英伟达等企业在半导体领域的多项技术创新。

来自主题: AI技术研报

8521 点击 2024-08-25 11:27

视频生成要有自己的系统！尤洋团队历时半年开源VideoSys

视频时代需要自己的基础设施。VideoSys 的目标是使视频生成对于每个人而言都简便、迅速且成本低廉。

来自主题: AI技术研报

10965 点击 2024-08-25 11:23

10行代码让大模型数学提升20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才

只要不到10行代码，就能让大模型数学能力（GSM8k）提升20%！

来自主题: AI技术研报

11139 点击 2024-08-24 16:27

程序员为何容易爱上AI？MIT学者诊断：「智性恋」浓度过高！

OpenAI警告说，跟人工智能语音聊天可能会产生「情感依赖」。这种情感依赖是怎么产生的呢？MIT的一项研究指出，这可能是「求仁得仁」的结果，无怪乎连软件工程师也会对AI着迷。

来自主题: AI技术研报

8846 点击 2024-08-24 16:08

语言图像模型大一统！Meta将Transformer和Diffusion融合，多模态AI王者登场

就在刚刚，Meta最新发布的Transfusion，能够训练生成文本和图像的统一模型了！完美融合Transformer和扩散领域之后，语言模型和图像大一统，又近了一步。也就是说，真正的多模态AI模型，可能很快就要来了！

来自主题: AI技术研报

11633 点击 2024-08-24 16:04

浅谈领域模型训练

这篇文章对如何进行领域模型训练进行一个简单的探讨，主要内容是对 post-pretrain 阶段进行分析，后续的 Alignment 阶段就先不提了，注意好老生常谈的“数据质量”和“数据多样性”即可。

来自主题: AI技术研报

11376 点击 2024-08-24 10:54

Transformer核心作者重返谷歌，任Gemini联合技术负责人！联手Jeff Dean追赶竞敌

被谷歌买下的AI独角兽Character.AI，已与团队深度融合。Transformer核心作者、创始人之一Noam Shazeer将担任Gemini联合技术负责人，与Jeff Dean和Oriol Vinyals平起平坐。

来自主题: AI技术研报

11078 点击 2024-08-24 10:50

陈天桥联手Science推AI驱动科学大奖！千字论文抱走3万美金，挖掘诺奖潜力股

AI大佬陈天桥，联手Science官宣设立AI驱动科学大奖！评奖征集内容为1000字左右的论文，大奖和优胜者会分获3万美元和1万美元的奖励，截止时间为2024年12月13日。

来自主题: AI技术研报

12362 点击 2024-08-24 10:46

如何让等变神经网络可解释性更强？试试将它分解成「简单表示」

神经网络是一种灵活且强大的函数近似方法。而许多应用都需要学习一个相对于某种对称性不变或等变的函数。图像识别便是一个典型示例 —— 当图像发生平移时，情况不会发生变化。等变神经网络（equivariant neural network）可为学习这些不变或等变函数提供一个灵活的框架。

来自主题: AI技术研报

9693 点击 2024-08-23 18:10

总说具身智能的数据太贵，鹏城实验室开源百万规模标准化数据集

今年以来，具身智能正在成为学术界和产业界的热门领域，相关的产品和成果层出不穷。

来自主题: AI技术研报

10993 点击 2024-08-23 18:04

用AI自动设计智能体，数学提分25.9%，远超手工设计

AI，智能体，ADAS，元智能体搜索，模型训练

来自主题: AI技术研报

8792 点击 2024-08-23 17:39

明确了：文本数据中加点代码，训练出的大模型更强、更通用

代码知识原来这么重要。

来自主题: AI技术研报

11688 点击 2024-08-23 17:18

大模型时代的ASR就是不一样！豆包“听力”水平现场评测，方言&小朋友口音直接拿捏！

8 月 21 日，2024 火山引擎 AI 创新巡展﹒上海站带来了豆包大模型最新进展。

来自主题: AI技术研报

13889 点击 2024-08-23 17:02

LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

Emory大学的研究团队提出了一种创新的方法，将大语言模型（LLM）在文本图（Text-Attributed Graph, 缩写为TAG）学习中的强大能力蒸馏到本地模型中，以应对文本图学习中的数据稀缺、隐私保护和成本问题。通过训练一个解释器模型来理解LLM的推理过程，并对学生模型进行对齐优化，在多个数据集上实现了显著的性能提升，平均提高了6.2%。

来自主题: AI技术研报

12366 点击 2024-08-23 16:35

GPT-4无师自通预测蛋白质结构登Nature子刊！LLM全面进军生物学，AlphaFold被「偷家」?

距离GPT-4首次发布已经过去了将近一年半的时间，Nature最近发表的一篇报告却探索出了这个「过气」模型的新用途——氨基酸和蛋白质的结构建模。

来自主题: AI技术研报

9012 点击 2024-08-23 16:28

「C位观察」数据流动的艺术：构建AI时代的高速通信网络

为了实现算力层面的提升和追赶，国内有大量的厂商和从业者在各个产业链环节努力。但面对中短期内架构、制程、产能、出口禁令等多方面的制约，我们认为从芯片层面实现单点的突破依旧是非常困难且不足的。

来自主题: AI技术研报

7477 点击 2024-08-23 15:10

搜索图片有新招了！北大袁粒课题组提出图像检索新方法，输入草图or艺术or低分辨率 | ECCV 2024

从一大堆图片中精准找图，有新招了！论文已经中了ECCV 2024。

来自主题: AI技术研报

7843 点击 2024-08-22 16:49

多亏Transformer，Mamba更强了！仅用1%计算量达新SOTA

Attention is all you need.

来自主题: AI技术研报

11402 点击 2024-08-22 16:44

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

PolygonGNN是一种新型框架，用于学习包括单一和多重多边形在内的多边形几何体的表征，它通过异质可见图来捕捉多边形内外的空间关系，并利用图神经网络有效处理这些关系，以提高计算效率和泛化能力。该框架在五个数据集上表现出色，证明了其在捕捉多边形几何体有用表征方面的有效性。

来自主题: AI技术研报

7455 点击 2024-08-21 18:27

微软「小而美」系列三连发！视觉小钢炮PK GPT-4o，MoE新秀力压Llama 3.1

微软Phi 3.5系列上新了！mini模型小而更美，MoE模型首次亮相，vision模型专注多模态。

来自主题: AI技术研报

6674 点击 2024-08-21 18:14

当Agent开始自己创造自己，AI产品爆发还会是遥远的梦吗？

2024年，AI 领域中最炙手可热的话题无疑是Agent。

来自主题: AI技术研报

10046 点击 2024-08-21 15:05

锚定效应与AI：智能算法如何应对认知偏差

随着人工智能技术的广泛应用，人们认为AI可以避免人类常见的认知偏差。然而，AI本身可能会表现出类似于人类的偏差，例如锚定效应。本文通过回顾“系统1”和“系统2”两个思维模式，探讨AI在这两种模式中的运作方式，分析AI产生认知偏差的原因，并通过具体实验展示AI在面对锚定效应时的表现。本文进一步探讨如何在理解这些局限性的基础上，合理利用AI来改善人类决策质量，并强调AI透明性和可解释性的重要性。

来自主题: AI技术研报

7240 点击 2024-08-21 14:33

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，零污染

随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现出了越来越接近闭源的性能。

来自主题: AI技术研报

12684 点击 2024-08-21 14:28

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。

来自主题: AI技术研报

10775 点击 2024-08-21 14:20

爆火神经网络架构KAN更新2.0！研究者可专属定制，轻松应对经典物理学研究，作者：和MLP不能互相取代

爆火神经网络架构KAN，上新了！

来自主题: AI技术研报

10424 点击 2024-08-21 14:02

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

本期我们邀请到了纽约大学计算机科学院博士童晟邦带来【多模态大模型：视觉为中心的探索】的主题分享。

来自主题: AI技术研报

12971 点击 2024-08-21 10:39

非凡产研：2024年7月全球AIGC行业月报-流量篇

本报告展示及分析了2024年7月全球AI产品的流量态势，通过全球、国内及出海等不同维度进行了详尽的展示。报告涵盖了访问量、下载量、独立访客、APP收入、访问时长以及移动页面占比等核心指标。

来自主题: AI技术研报

10043 点击 2024-08-20 14:51

AI设计自己，代码造物主已来！UBC华人一作首提ADAS，数学能力暴涨25.9%

AI掌握自我设计的权力，将会怎样？最近，来自UBC等机构研究人员提出了「智能体自动化设计」系统，让元智能体使用搜索算法，自动构建强大的同类。

来自主题: AI技术研报

11233 点击 2024-08-20 14:47

AI技术研报-这里有最前沿的人工智能技术解读

从ACL 2024录用论文看混合专家模型（MoE）最新研究进展

ECCV 2024 | 机器遗忘之后，扩散模型真正安全了吗？

上交大新型SRAM存内计算架构「COMPASS」，开启类脑计算新时代

视频生成要有自己的系统！尤洋团队历时半年开源VideoSys

10行代码让大模型数学提升20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才

程序员为何容易爱上AI？MIT学者诊断：「智性恋」浓度过高！

语言图像模型大一统！Meta将Transformer和Diffusion融合，多模态AI王者登场

浅谈领域模型训练

Transformer核心作者重返谷歌，任Gemini联合技术负责人！联手Jeff Dean追赶竞敌

陈天桥联手Science推AI驱动科学大奖！千字论文抱走3万美金，挖掘诺奖潜力股

如何让等变神经网络可解释性更强？试试将它分解成「简单表示」

总说具身智能的数据太贵，鹏城实验室开源百万规模标准化数据集

用AI自动设计智能体，数学提分25.9%，远超手工设计

明确了：文本数据中加点代码，训练出的大模型更强、更通用

大模型时代的ASR就是不一样！豆包“听力”水平现场评测，方言&小朋友口音直接拿捏！

LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

GPT-4无师自通预测蛋白质结构登Nature子刊！LLM全面进军生物学，AlphaFold被「偷家」?

「C位观察」数据流动的艺术：构建AI时代的高速通信网络

搜索图片有新招了！北大袁粒课题组提出图像检索新方法，输入草图or艺术or低分辨率 | ECCV 2024

多亏Transformer，Mamba更强了！仅用1%计算量达新SOTA

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

微软「小而美」系列三连发！视觉小钢炮PK GPT-4o，MoE新秀力压Llama 3.1

当Agent开始自己创造自己，AI产品爆发还会是遥远的梦吗？

锚定效应与AI：智能算法如何应对认知偏差

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，零污染

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

爆火神经网络架构KAN更新2.0！研究者可专属定制，轻松应对经典物理学研究，作者：和MLP不能互相取代

Beidi Chen陈贝迪 独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

非凡产研：2024年7月全球AIGC行业月报-流量篇

AI设计自己，代码造物主已来！UBC华人一作首提ADAS，数学能力暴涨25.9%

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design