AI技术研报-这里有最前沿的人工智能技术解读

人类自身都对不齐，怎么对齐AI？新研究全面审视偏好在AI对齐中的作用

让 AI 与人类价值观对齐一直都是 AI 领域的一大重要且热门的研究课题，甚至很可能是 OpenAI 高层分裂的一大重要原因 ——CEO 萨姆・奥特曼似乎更倾向于更快实现 AI 商业化，而以伊尔亚・苏茨克维（Ilya Sutskever）为代表的一些研究者则更倾向于先保证 AI 安全。

来自主题: AI技术研报

3134 点击 2024-10-22 16:57

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

Maitrix.org 是由 UC San Diego, John Hopkins University, CMU， MBZUAI 等学术机构学者组成的开源组织，致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。

来自主题: AI技术研报

4691 点击 2024-10-22 14:38

DeepSeek新作Janus：解耦视觉编码，引领多模态理解与生成统一新范式

我们提出了 Janus，一种基于自回归的多模态理解与生成统一模型。

来自主题: AI技术研报

3540 点击 2024-10-22 14:35

大模型是否有推理能力？DeepMind数月前的论文让AI社区吵起来了

最近，DeepMind 今年 2 月份的一篇论文在社交媒体上掀起了一些波澜。

来自主题: AI技术研报

2972 点击 2024-10-22 14:25

最新认知Prompt，模拟人类认知操作COP来增强LLM问题解决能力 | ICLR2025

困扰数学家一个多世纪的难题，AI从生物学中找到线索

纽结理论长期困扰着数学家，但随着人工智能的进步，有研究者在生物学中找到了突破口，因为纽结结构存在于许多重要的生物分子中，例如蛋白质、DNA等。对于难以识别归类的复杂纽结结构，AI给出了令人惊讶的结果。

来自主题: AI技术研报

4321 点击 2024-10-21 14:57

重磅：用DSPy写最佳推理轨迹搜索DOTS，让LLM能动态推理 |乔治梅森大学和腾讯AI最新

近日，来自乔治梅森大学和腾讯AI实验室的研究团队在这一领域取得了重大突破。他们提出了一种名为DOTS（Dynamic Optimal Trajectory Search）的创新方法，通过最佳推理轨迹搜索，显著提升LLMs的动态推理能力。

来自主题: AI技术研报

4579 点击 2024-10-21 14:51

NeurIPS 2024 | 标签噪声下图神经网络有了首个综合基准库，还开源

多年来，浙江大学周晟老师团队与阿里安全交互内容安全团队持续开展产学研合作。近日，双⽅针对标签噪声下图神经⽹络的联合研究成果《NoisyGL：标签噪声下图神经网络的综合基准》被 NeurIPS Datasets and Benchmarks Track 2024 收录。本次 NeurIPS D&B Track 共收到 1820 篇投稿，录⽤率为 25.3%。

来自主题: AI技术研报

4282 点击 2024-10-21 14:42

突破视频多模态大模型瓶颈！「合成数据」立大功，项目已开源

视频多模态大模型（LMMs）的发展受限于从网络获取大量高质量视频数据。为解决这一问题，我们提出了一种替代方法，创建一个专为视频指令跟随任务设计的高质量合成数据集，名为 LLaVA-Video-178K。

来自主题: AI技术研报

3615 点击 2024-10-21 14:33

遥感影像也能AI搜索？从像素到语义，快速实现

近期在LLM方面，AI搜索热度居高不下，遥感业务也能做AI搜索。

来自主题: AI技术研报

3847 点击 2024-10-21 11:34

颜水成袁粒提出新一代MoE架构：专家吞吐速度最高提升2.1倍！

比传统MoE推理速度更快、性能更高的新一代架构，来了！这个通用架构叫做MoE++，由颜水成领衔的昆仑万维2050研究院与北大袁粒团队联合提出。

来自主题: AI技术研报

3889 点击 2024-10-21 11:22

低内存占用也能实现满血训练？！北理北大港中文MMLab推出Fira训练框架

内存占用小，训练表现也要好……大模型训练成功实现二者兼得。来自北理、北大和港中文MMLab的研究团队提出了一种满足低秩约束的大模型全秩训练框架——Fira，成功打破了传统低秩方法中内存占用与训练表现的“非此即彼”僵局。

来自主题: AI技术研报

3729 点击 2024-10-21 10:58

开源两周4.7k标星，港大LightRAG大幅降低大模型问答成本，全面理解复杂实体依赖关系

简单高效的大模型检索增强系统LightRAG，香港大学黄超团队最新研究成果。开源两周时间在GitHub上获得将近5k标星，并登上趋势榜。

来自主题: AI技术研报

4367 点击 2024-10-21 10:23

陶哲轩：纳维-斯托克斯方程或已不再是流体的良好模型

能拿下数学奥赛银牌水平的AI是否达到了12岁陶哲轩的水平？陶神本人的回答来了

来自主题: AI技术研报

3730 点击 2024-10-21 09:53

人工智能在职场：GenAI如何更可能成为员工的助力而非替代者

Indeed Hiring Lab 评估了OpenAI开发的生成式AI模型GPT-4在超过2800项工作技能中的表现。

来自主题: AI技术研报

3943 点击 2024-10-21 09:45

谷歌&MIT何恺明团队：视觉大模型像LLM一样高效Scaling，指路连续token+随机生成顺序

来自主题: AI技术研报

4740 点击 2024-10-20 17:34

大模型在装傻！谷歌苹果最新发现：LLM知道但不告诉你，掌握知识比表现出来的多

近日，来自谷歌和苹果的研究表明：AI模型掌握的知识比表现出来的要多得多！这些真实性信息集中在特定的token中，利用这一属性可以显著提高检测LLM错误输出的能力。

来自主题: AI技术研报

3735 点击 2024-10-20 17:16

英伟达nGPT重塑Transformer，AI训练速度暴增20倍！文本越长，加速越快

LLM训练速度还可以再飙升20倍！英伟达团队祭出全新架构归一化Transformer（nGPT），上下文越长，训练速度越快，还能维持原有精度。

来自主题: AI技术研报

3988 点击 2024-10-20 17:11

NeurIPS 2024 Oral | 小参数，大作为！揭秘非对称 LoRA 架构的高效性能

大型语言模型（LLMs）虽然在适应新任务方面取得了长足进步，但它们仍面临着巨大的计算资源消耗，尤其在复杂领域的表现往往不尽如人意。

来自主题: AI技术研报

4499 点击 2024-10-20 16:58

视频生成模型变身智能体：斯坦福Percy Liang等提出VideoAgent，竟能自我优化

现在正是「文本生视频」赛道百花齐放的时代，而且其应用场景非常多，比如生成创意视频内容、创建游戏场景、制作动画和电影。

来自主题: AI技术研报

3901 点击 2024-10-20 16:55

132年未解开的李雅普诺夫函数谜题，被Symbolic Transformer攻克了

牛顿没解决的问题，AI给你解决了？ AI的推理能力一直是研究的焦点。作为最纯粹、要求最高的推理形式之一，能否解决高级的数学问题，无疑是衡量语言模型推理水平的一把尺。

来自主题: AI技术研报

4023 点击 2024-10-20 16:41

OCR-Omni来了，字节&华师统一多模态文字理解与生成 | NeurIPS2024

多模态生成新突破，字节&华师团队打造TextHarmony，在单一模型架构中实现模态生成的统一，并入选NeurIPS 2024。

来自主题: AI技术研报

3763 点击 2024-10-20 11:48

率先突破大规模多类数据损坏问题！中科大离线强化学习新方式入选NeurIPS 2024

机器人控制和自动驾驶的离线数据损坏问题有解了！中科大王杰教授团队 (MIRA Lab) 提出了一种变分贝叶斯推断方法，有效地提升了智能决策模型的鲁棒性。

来自主题: AI技术研报

3659 点击 2024-10-20 11:43

苹果一篇论文得罪大模型圈？Transformer不会推理，只是高级模式匹配器！所有LLM都判死刑

苹果研究者发现：无论是OpenAI GPT-4o和o1，还是Llama、Phi、Gemma和Mistral等开源模型，都未被发现任何形式推理的证据，而更像是复杂的模式匹配器。无独有偶，一项多位数乘法的研究也被抛出来，越来越多的证据证实：LLM不会推理！

来自主题: AI技术研报

3761 点击 2024-10-19 16:32

大模型训练遭投毒损失千万美元？Anthropic惊人发现：LLM植入炸弹，代码库暗藏bug！

最近，大模型训练遭恶意攻击事件已经刷屏了。就在刚刚，Anthropic也发布了一篇论文，探讨了前沿模型的巨大破坏力，他们发现：模型遇到危险任务时会隐藏真实能力，还会在代码库中巧妙地插入bug，躲过LLM和人类「检查官」的追踪！

来自主题: AI技术研报

3779 点击 2024-10-19 16:24

Jurgen、曼宁等大佬新作：MoE重塑6年前的Universal Transformer，高效升级

7 年前，谷歌在论文《Attention is All You Need》中提出了 Transformer。就在 Transformer 提出的第二年，谷歌又发布了 Universal Transformer（UT）。它的核心特征是通过跨层共享参数来实现深度循环，从而重新引入了 RNN 具有的循环表达能力。

来自主题: AI技术研报

9028 点击 2024-10-19 14:29

又快又准，即插即用！清华8比特量化Attention，两倍加速于FlashAttention2，各端到端任务均不掉点！

来自主题: AI技术研报

9059 点击 2024-10-19 14:15

SAM 2.1上新、Lingua代码库发布，一大波Meta开源工具来袭

今天，Meta 分享了一系列研究和模型，这些研究和模型支撑 Meta 实现高级机器智能（AMI）目标，同时也致力于开放科学和可复现性。

来自主题: AI技术研报

7199 点击 2024-10-19 14:07

Bengio团队新论文！KL正则化有漏洞，强化学习新策略：不要做我可能不会做的事情

在强化学习中，当智能体的奖励机制与设计者的意图不一致时，可能会导致不理想的行为，而KL正则化作为一种常用的解决方案，通过限制智能体的行为来防止这种情况，但智能体在某些情况下仍可能表现出意料之外的行为；为了提高智能体的可靠性，研究人员提出了新的理论方案，通过改变指导原则来增强智能体在未知情况下的谨慎性。

来自主题: AI技术研报

6370 点击 2024-10-19 13:55

卷起来！让智能体评估智能体，Meta发布Agent-as-a-Judge

微软发布了 Copilot，Apple 将 Apple Intelligence 接入了 OpenAI 以增强 Siri。

来自主题: AI技术研报

3956 点击 2024-10-18 13:59

AI技术研报-这里有最前沿的人工智能技术解读

人类自身都对不齐，怎么对齐AI？新研究全面审视偏好在AI对齐中的作用

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

DeepSeek新作Janus：解耦视觉编码，引领多模态理解与生成统一新范式

大模型是否有推理能力？DeepMind数月前的论文让AI社区吵起来了

最新认知Prompt，模拟人类认知操作COP来增强LLM问题解决能力 | ICLR2025

困扰数学家一个多世纪的难题，AI从生物学中找到线索

重磅：用DSPy写最佳推理轨迹搜索DOTS，让LLM能动态推理 |乔治梅森大学和腾讯AI最新

NeurIPS 2024 | 标签噪声下图神经网络有了首个综合基准库，还开源

突破视频多模态大模型瓶颈！「合成数据」立大功，项目已开源

遥感影像也能AI搜索？从像素到语义，快速实现

颜水成袁粒提出新一代MoE架构：专家吞吐速度最高提升2.1倍！

低内存占用也能实现满血训练？！北理北大港中文MMLab推出Fira训练框架

开源两周4.7k标星，港大LightRAG大幅降低大模型问答成本，全面理解复杂实体依赖关系

陶哲轩：纳维-斯托克斯方程或已不再是流体的良好模型

人工智能在职场：GenAI如何更可能成为员工的助力而非替代者

谷歌&MIT何恺明团队：视觉大模型像LLM一样高效Scaling，指路连续token+随机生成顺序

大模型在装傻！谷歌苹果最新发现：LLM知道但不告诉你，掌握知识比表现出来的多

英伟达nGPT重塑Transformer，AI训练速度暴增20倍！文本越长，加速越快

NeurIPS 2024 Oral | 小参数，大作为！揭秘非对称 LoRA 架构的高效性能

视频生成模型变身智能体：斯坦福Percy Liang等提出VideoAgent，竟能自我优化

132年未解开的李雅普诺夫函数谜题，被Symbolic Transformer攻克了

OCR-Omni来了，字节&华师统一多模态文字理解与生成 | NeurIPS2024

率先突破大规模多类数据损坏问题！中科大离线强化学习新方式入选NeurIPS 2024

苹果一篇论文得罪大模型圈？Transformer不会推理，只是高级模式匹配器！所有LLM都判死刑

大模型训练遭投毒损失千万美元？Anthropic惊人发现：LLM植入炸弹，代码库暗藏bug！

Jurgen、曼宁等大佬新作：MoE重塑6年前的Universal Transformer，高效升级

又快又准，即插即用！清华8比特量化Attention，两倍加速于FlashAttention2，各端到端任务均不掉点！

SAM 2.1上新、Lingua代码库发布，一大波Meta开源工具来袭

Bengio团队新论文！KL正则化有漏洞，强化学习新策略：不要做我可能不会做的事情

卷起来！让智能体评估智能体，Meta发布Agent-as-a-Judge