AI技术研报-这里有最前沿的人工智能技术解读

大模型到底是怎么「思考」的？第一篇系统性综述SAE的文章来了

在 ChatGPT 等大语言模型（LLMs）席卷全球的今天，越来越多的研究者意识到：我们需要的不只是 “会说话” 的 LLM，更是 “能解释” 的 LLM。

来自主题: AI技术研报

7829 点击 2025-06-22 16:25

不用千亿参数也能合成高质量数据！这个开源框架让小模型“组团逆袭”，7B性能直追72B

无需蒸馏任何大规模语言模型，小模型也能自给自足、联合提升？

来自主题: AI技术研报

6403 点击 2025-06-22 16:13

从RLHF、PPO到GRPO再训练推理模型，这是你需要的强化学习入门指南

强化学习（RL）已经成为当今 LLM 不可或缺的技术之一。从大模型对齐到推理模型训练再到如今的智能体强化学习（Agentic RL），你几乎能在当今 AI 领域的每个领域看到强化学习的身影。

来自主题: AI技术研报

5796 点击 2025-06-22 16:08

7B智能体仅凭9个任务训练即超越R1！上交大打造AI-for-AI新范式

尽管人工智能（AI）在飞速发展，当前 AI 开发仍严重依赖人类专家大量的手动实验和反复的调参迭代，过程费时费力。

来自主题: AI技术研报

6819 点击 2025-06-22 15:58

知识储备≠模型能力！DeepMind强化学习微调：大幅缩小「知行差距」

大语言模型（LLMs）在决策场景中常因贪婪性、频率偏差和知行差距表现欠佳。研究者提出强化学习微调（RLFT），通过自我生成的推理链（CoT）优化模型，提升决策能力。实验表明，RLFT可增加模型探索性，缩小知行差距，但探索策略仍有改进空间。

来自主题: AI技术研报

6146 点击 2025-06-22 11:34

地球副本上线！人类机器人蜂拥进入「世界模拟器」，复刻全球3D真实空间

一个融合真实地理空间与AI生成技术的开放世界模拟平台，由Genesis物理引擎驱动，支持人类与机器人在社区中共同互动、成长与演化。

来自主题: AI技术研报

6641 点击 2025-06-21 20:03

世界模型版《模拟人生》：AI虚拟小人街头演讲拉票，GPT-4o选举获胜

一个真实世界模拟器。

来自主题: AI技术研报

6268 点击 2025-06-21 19:25

三个大模型合作，1000次迭代，竟能像人类科学家一样发现方程

随着 AI4Science 的浪潮席卷科研各领域，如何将强大的人工智能模型真正用于分析科学数据、构建数学模型、发现科学规律，正成为该领域亟待突破的关键问题。

来自主题: AI技术研报

5576 点击 2025-06-21 18:31

只改2行代码，RAG效率暴涨30%！多种任务适用，可扩展至百亿级数据规模应用

只需修改两行代码，RAG向量检索效率暴涨30%！

来自主题: AI技术研报

5355 点击 2025-06-21 17:48

ICML 2025 Oral | NAS老树开新花，NUS提出智能体超网，成本狂降55%

LLM 智能体的时代，单个 Agent 的能力已到瓶颈，组建像 “智能体天团” 一样的多智能体系统已经见证了广泛的成功

来自主题: AI技术研报

6900 点击 2025-06-21 17:05

突破开放世界移动操作！首个室内移动抓取多模态智能体亮相，微调模型真实环境零样本动作准确率达 90%

在家庭服务机器人领域，如何让机器人理解开放环境中的自然语言指令、动态规划行动路径并精准执行操作，一直是学界和工业界的核心挑战。

来自主题: AI技术研报

5791 点击 2025-06-21 16:56

大模型掌握人类空间思考能力！三阶段训练框架学会“边画边想”，5个基准平均提升18.4%

“边看边画，边画边想”，让大模型掌握空间思考能力，结果直接实现空间推理任务新SOTA。

来自主题: AI技术研报

5796 点击 2025-06-21 16:48

打破推荐系统「信息孤岛」！中科大与华为提出首个生成式多阶段统一框架，性能全面超越 SOTA

在信息爆炸的时代，推荐系统已成为我们获取资讯、商品和服务的核心入口。无论是电商平台的 “猜你喜欢”，还是内容应用的信息流，背后都离不开推荐算法的默默耕耘

来自主题: AI技术研报

5777 点击 2025-06-21 12:53

AI App 2024年赚了12亿美元，谁在给AI氪金？

2024年全球AI移动应用收入达12亿美元，同比猛增179%。图片/视频生成应用主要由亚洲市场驱动，细分需求兴起；ChatBot领域ChatGPT占据主导，但套壳产品表现意外强劲，用户分层明显（高知男性与年轻女性为主）。AI赋能生产力工具收入显著增长34.9%，但大厂优势依旧显著。

来自主题: AI技术研报

6090 点击 2025-06-21 11:32

国产SOTA新模型精准get“画(3+6)条命的动物” | 开源

生成图像这件事，会推理的AI才是好AI。举个例子，以往要是给AI一句这样的Prompt：（3+6）条命的动物。我们人类肯定一眼就知道是猫咪，但AI的思考过程却是这样的：

来自主题: AI技术研报

7207 点击 2025-06-20 16:08

人人皆可创作音乐！腾讯AI Lab开源音乐生成大模型SongGeneration

6 月 16 日，腾讯 AI Lab 推出并开源 SongGeneration 音乐生成大模型，专注解决音乐 AIGC 中音质、音乐性与生成速度这三大共性难题

来自主题: AI技术研报

7249 点击 2025-06-20 15:50

李飞飞团队提出架构设计新思路！无需从头训练，直接“嫁接”预训练模型关键组件

预训练模型能否作为探索新架构设计的“底座” ？最新答案是：yes！

来自主题: AI技术研报

8222 点击 2025-06-20 15:38

Agent全自动搭建代码运行环境，实时更新解决评测过拟合/数据污染问题｜微软

长期以来主流的代码修复评测基准SWE-bench面临数据过时、覆盖面窄、手动维护成本高等问题，严重制约了AI模型真实能力的展现。

来自主题: AI技术研报

7201 点击 2025-06-20 15:23

推荐大模型来了？OneRec论文解读：端到端训练如何同时吃掉效果与成本

人人都绕不开的推荐系统，如今正被注入新的 AI 动能。随着 AI 领域掀起一场由大型语言模型（LLM）引领的生成式革命，它们凭借着强大的端到端学习能力、海量数据理解能力以及前所未有的内容生成潜力，开始重塑各领域的传统技术栈。

来自主题: AI技术研报

7677 点击 2025-06-20 11:08

DPO与GRPO谁更胜一筹？港中文、北大等联合发布首个系统性对比研究

近年来，强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力，其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大主流算法。

来自主题: AI技术研报

7248 点击 2025-06-20 10:53

何恺明CVPR最新讲座PPT上线：走向端到端生成建模

生成模型会重现识别模型的历史吗？

来自主题: AI技术研报

8006 点击 2025-06-20 09:54

AI哪怕答案正确，逻辑链却惨不忍睹，奥数级不等式证明成功率不到50%｜斯坦福&伯克利&MIT

大语言模型解决不等式证明问题时，可以给出正确答案，但大多数时候是靠猜。推理过程经不起推敲，逻辑完全崩溃。

来自主题: AI技术研报

5851 点击 2025-06-20 09:48

能自我提升的Agent需要内在的元认知学习能力。| 剑桥ICML最新

剑桥大学和范德夏尔实验室在 ICML 2024 上发表的立场论文，直接挑战了当前Agent开发的核心假设：我们一直在用错误的方式让Agent"自我改进"。

来自主题: AI技术研报

5678 点击 2025-06-20 09:39

美团提出首个语音交互GUI智能体，端到端语音训练能力优于传统文本训练

只需要动动嘴就可以驱动GUI代理？

来自主题: AI技术研报

6858 点击 2025-06-19 17:07

田渊栋：连续思维链效率更高，可同时编码多个路径，“叠加态”式并行搜索

AI也有量子叠加态了？

来自主题: AI技术研报

7508 点击 2025-06-19 15:25

ChatGPT上瘾，大脑萎缩47%！MIT祭出206页92图超长报告

AI上瘾堪比「吸毒」！MIT最新研究惊人发现：长期依赖大模型，学习能力下降、大脑受损，神经连接减少47%。AI提高效率的说法，或许根本就是误解！

来自主题: AI技术研报

6450 点击 2025-06-19 15:04

单GPU搞定高清长视频生成，效率×10！引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta

普林斯顿大学和Meta联合推出的新框架LinGen，以MATE线性复杂度块取代传统自注意力，将视频生成从像素数的平方复杂度压到线性复杂度，使单张GPU就能在分钟级长度下生成高质量视频，大幅提高了模型的可扩展性和生成效率。

来自主题: AI技术研报

6482 点击 2025-06-19 12:07

斯坦福最新研究：硅谷的AI创业潮，其实是一场大型的资源错配

2025年1月到5月间，斯坦福大学的研究团队完成了一项本应在AI热潮开始时就进行的调查。他们采访了1500名美国员工和52名AI专家，评估了104个职业中的844项具体任务。

来自主题: AI技术研报

6774 点击 2025-06-19 11:40

字节Seed提出序贯策略优化方法，突破同传“质量-延迟”权衡问题

为此，香港中文大学、字节跳动Seed和斯坦福大学研究团队出手，提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT)。

来自主题: AI技术研报

6064 点击 2025-06-19 11:31

港科广等发布首个医学世界模型！精准模拟肿瘤演化，规划治疗方案

医学世界模型（MeWM）是一种创新的AI系统，能够模拟疾病演变并预测不同治疗方案下的肿瘤变化。通过生成术后肿瘤图像，可以帮助医生在术前评估治疗效果，优化治疗方案，显著提升临床决策的准确性，为精准医疗提供了有力支持。

来自主题: AI技术研报

5806 点击 2025-06-19 11:18

AI技术研报-这里有最前沿的人工智能技术解读

大模型到底是怎么「思考」的？第一篇系统性综述SAE的文章来了

不用千亿参数也能合成高质量数据！这个开源框架让小模型“组团逆袭”，7B性能直追72B

从RLHF、PPO到GRPO再训练推理模型，这是你需要的强化学习入门指南

7B智能体仅凭9个任务训练即超越R1！上交大打造AI-for-AI新范式

知识储备≠模型能力！DeepMind强化学习微调：大幅缩小「知行差距」

地球副本上线！人类机器人蜂拥进入「世界模拟器」，复刻全球3D真实空间

世界模型版《模拟人生》：AI虚拟小人街头演讲拉票，GPT-4o选举获胜

三个大模型合作，1000次迭代，竟能像人类科学家一样发现方程

只改2行代码，RAG效率暴涨30%！多种任务适用，可扩展至百亿级数据规模应用

ICML 2025 Oral | NAS老树开新花，NUS提出智能体超网，成本狂降55%

突破开放世界移动操作！首个室内移动抓取多模态智能体亮相，微调模型真实环境零样本动作准确率达 90%

大模型掌握人类空间思考能力！三阶段训练框架学会“边画边想”，5个基准平均提升18.4%

打破推荐系统「信息孤岛」！中科大与华为提出首个生成式多阶段统一框架，性能全面超越 SOTA

AI App 2024年赚了12亿美元，谁在给AI氪金？

国产SOTA新模型精准get“画(3+6)条命的动物” | 开源

人人皆可创作音乐！腾讯AI Lab开源音乐生成大模型SongGeneration

李飞飞团队提出架构设计新思路！无需从头训练，直接“嫁接”预训练模型关键组件

Agent全自动搭建代码运行环境，实时更新解决评测过拟合/数据污染问题｜微软

推荐大模型来了？OneRec论文解读：端到端训练如何同时吃掉效果与成本

DPO与GRPO谁更胜一筹？港中文、北大等联合发布首个系统性对比研究

何恺明CVPR最新讲座PPT上线：走向端到端生成建模

AI哪怕答案正确，逻辑链却惨不忍睹，奥数级不等式证明成功率不到50%｜ 斯坦福&伯克利&MIT

能自我提升的Agent需要内在的元认知学习能力。| 剑桥ICML最新

美团提出首个语音交互GUI智能体，端到端语音训练能力优于传统文本训练

田渊栋：连续思维链效率更高，可同时编码多个路径，“叠加态”式并行搜索

ChatGPT上瘾，大脑萎缩47%！MIT祭出206页92图超长报告

单GPU搞定高清长视频生成，效率×10！引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta

斯坦福最新研究：硅谷的AI创业潮，其实是一场大型的资源错配

字节Seed提出序贯策略优化方法，突破同传“质量-延迟”权衡问题

港科广等发布首个医学世界模型！精准模拟肿瘤演化，规划治疗方案

AI哪怕答案正确，逻辑链却惨不忍睹，奥数级不等式证明成功率不到50%｜斯坦福&伯克利&MIT