AI技术研报-这里有最前沿的人工智能技术解读

AI顶会ICML收了一篇论文：没算法没实验

没有算法没有实验，从2610篇收录论文中脱颖而出，成为唯一一篇纯理论入选2024 ICML Spotlight的论文。

来自主题: AI技术研报

10515 点击 2024-08-04 14:14

阿里「轨迹可控版Sora」，告别「抽卡」，让视频生成更符合物理规律

你规定路线，Tora 来生成相应轨迹的视频。

来自主题: AI技术研报

9726 点击 2024-08-04 14:01

可解释性终极追问，什么才是第一性解释？20篇CCF-A+ICLR论文给你答案

本文首先简单回顾了『等效交互可解释性理论体系』（20 篇 CCF-A 及 ICLR 论文），并在此基础上，严格推导并预测出神经网络在训练过程中其概念表征及其泛化性的动力学变化，即在某种程度上，我们可以解释在训练过程中神经网络在任意时间点的泛化性及其内在根因。

来自主题: AI技术研报

10113 点击 2024-08-04 13:55

领英 AI 落地复盘：多 Agent 配合、端到端输出

在过去的六个月，LinkedIn 开发了基于自身业务的生成式AI应用。领英团队希望能重新设计求职流程，改变专业内容的浏览方式。

来自主题: AI技术研报

11072 点击 2024-08-04 13:26

DeepMind研究成本大起底，一篇ICML论文烧掉1290万美元

DeepMind最近被ICML 2024接收的一篇论文，完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本，大概是Llama 3预训练的15%，耗费资金可达12.9M美元。

来自主题: AI技术研报

8600 点击 2024-08-03 15:03

GPT-4o弱点暴露了，PDF长文档阅读理解仅45分

图文并茂的PDF长文档在日常生活中无处不在。过去人们通常使用OCR，layout detection等方法对PDF长文档进行解析。但随着多模态大模型的发展，PDF长文档的端到端阅读理解成为了可能。

来自主题: AI技术研报

10984 点击 2024-08-03 14:38

鹅厂机器狗登Nature子刊封面：动作敏捷如真狗，能玩定向越野

腾讯机器狗，登上了Nature子刊封面！

来自主题: AI技术研报

9798 点击 2024-08-03 14:35

首届大模型顶会COLM 高分论文：偏好搜索算法PairS，让大模型进行文本评估更高效

大模型展现出了卓越的指令跟从和任务泛化的能力，这种独特的能力源自 LLMs 在训练中使用了指令跟随数据以及人类反馈强化学习（RLHF）。

来自主题: AI技术研报

11232 点击 2024-08-03 14:29

ICML 2024演讲爆火！Meta朱泽园揭秘大模型内心世界：不同于人类的2级推理

大语言模型 (LLM) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？

来自主题: AI技术研报

10381 点击 2024-08-03 14:25

顶级明星公司Character.AI创始人出走：我们都身在一个十字路口

热议数月的 Character AI 寻求收购的消息，终于尘埃落定。据 C.AI 官方博客，公司与 Google 达成协议，核心创始人 Noam Shazeer、Daniel De Freitas 以及研究团队，将加入 Google，剩余「大部分团队」将留在 C.AI，继续打造产品。

来自主题: AI技术研报

7574 点击 2024-08-03 11:22

RAG 高效应用指南 05：再谈文档智能解析

在这篇文章中，笔者将讨论以下几个问题： • 什么是文档智能解析 • 文档智能解析有哪些方法 • 文档智能解析的开源实现

来自主题: AI技术研报

10754 点击 2024-08-03 11:17

RAG 高效应用指南 04：语义路由

在这篇文章中，笔者将讨论以下几个问题： • 什么是语义路由 • RAG 路由的不同场景

来自主题: AI技术研报

10437 点击 2024-08-03 11:05

RAG 高效应用指南 03：Query 理解

在这篇文章中，笔者将讨论以下几个问题： • 为什么要进行 query 理解 • query 理解有哪些技术（从 RAG 角度） • 各种 query 理解技术的实现（基于 LangChain）

来自主题: AI技术研报

12762 点击 2024-08-03 10:57

RAG 高效应用指南 02：Embedding 模型的选择和微调

在本篇文章中，笔者将讨论以下几个问题： • 向量模型在 RAG 系统中的作用有哪些性能不错的向量模型（从 RAG 角度）不同向量模型的评测基准 MTEB 业务中选择向量模型有哪些考量如何 Finetune 向量模型

来自主题: AI技术研报

14149 点击 2024-08-03 10:44

RAG 高效应用指南：01

『RAG 高效应用指南』系列将就如何提高 RAG 系统性能进行深入探讨，提供一系列具体的方法和建议。同时读者也需要记住，提高 RAG 系统性能是一个持续的过程，需要不断地评估、优化和迭代。

来自主题: AI技术研报

12653 点击 2024-08-02 17:11

OpenDevin出技术报告了，大模型Agent开发者必读

今年 3 月，「全球首位 AI 软件工程师」Devin 引爆了 AI 圈。与此前 AI 编程助手不同的是，Devin 并不只是辅助编程的角色，而是能够独立地、端到端地完成整个开发项目。

来自主题: AI技术研报

9920 点击 2024-08-02 16:16

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住了

Llama 3.1 刚刚发布，你是否已经尝试了呢？就算你的个人计算机是最近的顶尖配置，运行其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。

来自主题: AI技术研报

10178 点击 2024-08-02 16:07

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！

来自主题: AI技术研报

11580 点击 2024-08-02 14:26

起猛了，GPT-4o被谷歌新模型击败，ChatGPT官号：大家深吸一口气

起猛了，GPT-4o被谷歌新模型超越了！

来自主题: AI技术研报

9692 点击 2024-08-02 14:18

人间一年，AI时代发电厂在京浮出水面！国产芯片集结，智能算力开箱即用

人工智能毫无疑问是当今一项重要议题，通过大模型、垂类应用、智能体等多种方式推动着数字经济的发展。

来自主题: AI技术研报

10622 点击 2024-08-02 14:10

OpenAI喜提姚班学霸姚顺雨：思维树作者，普林斯顿博士，还是个Rapper

清华姚班学霸姚顺雨，官宣加入了OpenAI。

来自主题: AI技术研报

11818 点击 2024-08-02 14:06

AI金融创新实践｜上海「Open Day」圆满落幕

7月25日，非凡产研举办的《金融科技新动力：AI在金融创新与服务中的应用》主题活动在上海圆满落幕。活动特别邀请到了三位AI+金融领域的资深专家深擎科技创始人&CEO 柴志伟、澜码科技创始人兼CEO 周健、甜新科技合伙人郭尔东分别进行了专题分享，跟参会嘉宾进行了答疑互动。

来自主题: AI技术研报

10046 点击 2024-08-02 12:02

【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

不同类型的数据配比如何配置:先通过小规模实验确定最优配比，然后将其应用到大模型的训练中。 Token配比结论：通用知识50%；数学与逻辑25%；代码17%；多语言8%。

来自主题: AI技术研报

10830 点击 2024-08-02 11:53

CMU&清华新作：让LLM自己合成数据来学习，特定任务性能同样大幅提升

为了解决这个问题，一些研究尝试通过强大的 Teacher Model 生成训练数据，来增强 Student Model 在特定任务上的性能。然而，这种方法在成本、可扩展性和法律合规性方面仍面临诸多挑战。在无法持续获得高质量人类监督信号的情况下，如何持续迭代模型的能力，成为了亟待解决的问题。

来自主题: AI技术研报

7668 点击 2024-08-01 15:55

还没排上SearchGPT？比Perplexity更好用的国产开源平替了解一下？

有 AI 在的科技圈，似乎没有中场休息。除了大模型发布不断，各家科技大厂也在寻找着第一个「杀手级」AI 应用的落脚之地。

来自主题: AI技术研报

8225 点击 2024-08-01 15:50

开放域检测新SOTA！中山大学美团出品，开源性能最强

开放域检测领域，迎来新进展——

来自主题: AI技术研报

9785 点击 2024-08-01 15:47

谷歌开源最强端侧小模型：2B参数越级跑赢GPT-3.5-Turbo，苹果15Pro运行飞快

今年 6 月底，谷歌开源了 9B、27B 版 Gemma 2 模型系列，并且自亮相以来，27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一，在真实对话任务中比其两倍规模以上的模型表现还要好。

来自主题: AI技术研报

7384 点击 2024-08-01 15:41

iPhone可跑2B小钢炮！谷歌Gemma 2来袭，最强显微镜剖解LLM大脑

谷歌DeepMind的小模型核弹来了，Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B！而同时发布的Gemma Scope，如显微镜一般打破LLM黑箱，让我们看清Gemma 2是如何决策的。

来自主题: AI技术研报

10649 点击 2024-08-01 15:32

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 | ACM MM2024

多模态对比学习（如CLIP）通过从互联网上抓取的数百万个图像-字幕对中学习，在零样本分类方面取得了显著进展。然而，这种依赖带来了隐私风险，因为黑客可能会未经授权地利用图像-文本数据进行模型训练，其中可能包括个人和隐私敏感信息。

来自主题: AI技术研报

8504 点击 2024-08-01 15:32

探索AI Agent的认知架构及记忆的实现机制

Agent的记忆实现和调用是提高Agent智能水平的关键。

来自主题: AI技术研报

11963 点击 2024-08-01 11:57