AI技术研报-这里有最前沿的人工智能技术解读

离谱！DeepSeek数个字母，竟要“反思内耗”八百遍？

最近，我撞见了一个 DeepSeek 又“认真”又“拧巴”的怪异场景。

来自主题: AI技术研报

8045 点击 2025-04-23 10:23

哇！首个MCPBench来了，MCP竟然不比Function Calls更有优势？ | 最新

你是否正在投入大量资源开发基于MCP的Agent，却从未质疑过一个基本假设：MCP真的比传统函数调用更有优势吗？ 2025年4月的这项开创性研究直接挑战了这一广泛接受的观点，其执行摘要明确指出："使用MCPs并不显示出比函数调用有明显改进"。

来自主题: AI技术研报

6104 点击 2025-04-23 09:45

AI也要007？Letta、伯克利提出「睡眠时间计算」，推理效率翻倍还不加钱

AI 也要 007 工作制了！

来自主题: AI技术研报

8078 点击 2025-04-22 19:08

142页长文揭秘DeepSeek-R1「思维大脑」！开启全新「思维链学」研究

DeepSeek-R1是近年来推理模型领域的一颗新星，它不仅突破了传统LLM的局限，还开启了全新的研究方向「思维链学」（Thoughtology）。这份长达142页的报告深入剖析了DeepSeek-R1的推理过程，揭示了其推理链的独特结构与优势，为未来推理模型的优化提供了重要启示。

来自主题: AI技术研报

8024 点击 2025-04-22 18:59

3D高斯泼溅算法大漏洞：数据投毒让GPU显存暴涨70GB，甚至服务器宕机

随着3D Gaussian Splatting（3DGS）成为新一代高效三维建模技术，它的自适应特性却悄然埋下了安全隐患。

来自主题: AI技术研报

7048 点击 2025-04-22 18:33

连Claude 3.5都败下阵来，大语言模型能否定位软件服务的故障根因？

论文的第一作者是香港中文大学（深圳）数据科学学院三年级博士生徐俊杰龙，指导老师为香港中文大学（深圳）数据科学学院的贺品嘉教授和微软主管研究员何世林博士。贺品嘉老师团队的研究重点是软件工程、LLM for DevOps、大模型安全。

来自主题: AI技术研报

5739 点击 2025-04-22 17:58

从0到1，一个产品经理用AI做一个APP

这款产品是一个改变世界的产品，而刚好有一个产品经理将其复刻出来了，即使一款产品拆解案例也是一个用AI产品从0到1搭建的过程。

来自主题: AI技术研报

6864 点击 2025-04-22 17:37

AI 时代如何更高效开发前端组件？21st.dev 给了一种答案

给大家推荐一个好东西：21st.dev ，大致上你可以将它理解为一个非常前卫的组件托管市场

来自主题: AI技术研报

5297 点击 2025-04-22 17:25

Sebastian Raschka长文：DeepSeek-R1、o3背后，RL推理训练正悄悄突破上限

只靠模型尺寸变大已经不行了？大语言模型（LLM）推理需要强化学习（RL）来「加 buff」。

来自主题: AI技术研报

7105 点击 2025-04-22 16:58

Claude竟藏着3307种「人格」？深扒70万次对话，这个AI会看人下菜碟

AI会无脑附和吗？Anthropic研究发现，Claude能根据场景切换人格：谈恋爱时化身情感导师，聊历史时秒变严谨学者。一些对话中，它强烈支持用户价值观，但在3%的情况下，它会果断抵制。

来自主题: AI技术研报

6817 点击 2025-04-22 16:24

AI创造新物理学，暴力破解引力波，宇宙观测开挂50倍，三体人直呼内行

AI设计新型引力波探测工具，推动物理学突破，宇宙观测扩大50倍。

来自主题: AI技术研报

5956 点击 2025-04-22 15:24

从Minecraft到虚幻5，AI首次实现3D游戏零样本迁移，跨游戏直接上手

无论你是技术创造者还是使用者，理解这场认知革命都至关重要。我们正在从「AI as tools」向「AI as thinking partners」转变，这不仅改变了技术的能力边界，也改变了我们与技术协作的方式。

来自主题: AI技术研报

5627 点击 2025-04-22 15:08

合成数据也能通吃真实世界？首个融合重建-预测-规划的生成式世界模型AETHER开源

近日，上海人工智能实验室（上海 AI 实验室）开源了生成式世界模型 AETHER。该模型全部由合成数据训练而成，不仅在传统重建与生成任务中表现领先，更首次赋予大模型在真实世界中的 3D 空间决策与规划能力，

来自主题: AI技术研报

3922 点击 2025-04-22 14:45

行业必读丨OpenAI 最新报告：构建 Agents 最佳实践

OpenAI 最近发布了三份针对企业客户的研究报告，本次挑选了其中的「A Practical guide to building AI agents」一篇进行了翻译。除非已经是 Agent 资深开发大佬，否则强烈建议 AI 行业的大家都来读一下这篇报告。

来自主题: AI技术研报

9153 点击 2025-04-22 09:30

UIUC联手谷歌发布Search-R1：大模型学会「边想边查」，推理、搜索无缝切换

DeepSeek-R1 展示了强化学习在提升模型推理能力方面的巨大潜力，尤其是在无需人工标注推理过程的设定下，模型可以学习到如何更合理地组织回答。然而，这类模型缺乏对外部数据源的实时访问能力，一旦训练语料中不存在某些关键信息，推理过程往往会因知识缺失而失败。

来自主题: AI技术研报

6991 点击 2025-04-22 09:02

谷歌联合强化学习之父：通过经验学习的4大核心，Agent将获得超人能力 |最新战略瞭望

本文对DeepMind两位泰斗级科学家David Silver和Richard Sutton的重磅论文《Welcome to the Era of Experience》进行了深度解读，我将其视为AI发展方向的一份战略瞭望图。

来自主题: AI技术研报

7121 点击 2025-04-22 08:43

扩散LLM推理用上类GRPO强化学习！优于单独SFT，UCLA、Meta新框架d1开源

当前，强化学习（RL）方法在最近模型的推理任务上取得了显著的改进，比如 DeepSeek-R1、Kimi K1.5，显示了将 RL 直接用于基础模型可以取得媲美 OpenAI o1 的性能不过，基于 RL 的后训练进展主要受限于自回归的大语言模型（LLM），它们通过从左到右的序列推理来运行。

来自主题: AI技术研报

5126 点击 2025-04-22 08:39

o3被曝「无视」前成果？华人博士生实名指控，谢赛宁等大牛激烈争辩

o3和o4-mini视觉推理突破，竟未引用他人成果？一名华盛顿大学博士生发出质疑，OpenAI研究人员对此回应：不存在。

来自主题: AI技术研报

6366 点击 2025-04-21 16:16

为什么AI做的动画一眼就能看出来

动画片和我们拍摄的视频其实还是有很大不一样的。一般来说，我们平时观看的大多数电视剧使用25帧/秒的帧率，大多数电影使用24帧/秒的帧率。对于摄像机而言，帧率的调节无非是改一改摄影设备的参数，即使是胶片时代，也仅仅是胶片使用量的区别，对人工影响不大。

来自主题: AI技术研报

5078 点击 2025-04-21 13:53

强化学习之父当头一棒：RL版「苦涩的教训」来了！通往ASI，绝非靠人类数据

强化学习之父Richard Sutton和DeepMind强化学习副总裁David Silver对我们发出了当头棒喝：如今，人类已经由数据时代踏入经验时代。通往ASI之路要靠RL，而非人类数据！

来自主题: AI技术研报

8131 点击 2025-04-21 10:52

LeCun被痛批：你把Meta搞砸了！烧掉千亿算力，自曝折腾20年彻底失败

「一位顶尖科学家，有数千亿美元的资源，却仍然能把Meta搞砸了！」最近，圈内对LeCun的埋怨和批评，似乎越来越压不住了。有人批评说，Meta之所以溃败，LeCun的教条主义就是罪魁祸首。但LeCun却表示，自己尝试了20年自回归预测，彻底失败了，所以如今才给LLM判死刑！

来自主题: AI技术研报

8983 点击 2025-04-21 10:40

让DeepSeek更可靠！清华提出Hyper-RAG，用超图提升知识建模精准度

Hyper-RAG利用超图同时捕捉原始数据中的低阶和高阶关联信息，最大限度地减少知识结构化带来的信息丢失，从而减少大型语言模型（LLM）的幻觉。

来自主题: AI技术研报

5986 点击 2025-04-21 10:23

OpenAI爆出硬伤，强化学习是祸首！o3越强越「疯」，幻觉率狂飙

o3编码直逼全球TOP 200人类选手，却存在一个致命问题：幻觉率高达33%，是o1的两倍。Ai2科学家直指，RL过度优化成硬伤。

来自主题: AI技术研报

6997 点击 2025-04-21 09:41

264页智能体综述来了！MetaGPT等20家顶尖机构、47位学者参与

近期，大模型智能体（Agent）的相关话题爆火 —— 不论是 Anthropic 抢先 MCP 范式的快速普及，还是 OpenAI 推出的 Agents SDK 以及谷歌最新发布的 A2A 协议，都预示了 AI Agent 的巨大潜力。

来自主题: AI技术研报

5658 点击 2025-04-21 09:28

AI版本宝可梦冲榜上全球前10%！一次性「吃掉」10年47.5万场人类对战数据

还在用搜索和规则训练AI游戏？现在直接「看回放」学打宝可梦了！德州大学奥斯汀分校的研究团队用Transformer和离线强化学习打造出一个智能体，不靠规则、没用启发式算法，纯靠47.5万场人类对战回放训练出来，居然打上了Pokémon Showdown全球前10%！

来自主题: AI技术研报

7912 点击 2025-04-20 22:19

2025，如何理解AI制药

当前，人们对人工智能驱动的药物发现公司（以下简称 AIDD）这一新兴公司确发有效的界定。2025年开年，DeepSeek的爆火为AI医疗和AI制药领域带来了多维度变革。近日，BioPharma Trend发表了一份AI制药研究报告，报告力图从各个维度回答AI对生物医药的关键价值。

来自主题: AI技术研报

6817 点击 2025-04-20 21:49

具身空间数据技术的路线之争：合成重建VS全端生成

具身智能的突破离不开高质量数据。目前，具身合成数据有两条主要技术路线之争：“视频合成+3D重建”or “端到端3D生成”。英伟达在CES 2025指出“尚无互联网规模的机器人数据”，自动驾驶已具备城市级仿真，但家庭等复杂室内环境缺乏3D合成平台。

来自主题: AI技术研报

7035 点击 2025-04-20 21:42

仅需0.4GB，参数只有0和±1！微软开源首个原生1 bit模型，CPU轻松跑

微软研究院开源的原生1bit大模型BitNet b1.58 2B4T，将低精度与高效能结合，开创了AI轻量化的新纪元。通过精心设计的推理框架，BitNet不仅突破了内存的限制，还在多项基准测试中表现出色，甚至与全精度模型不相上下。

来自主题: AI技术研报

5792 点击 2025-04-20 21:12

马斯克炫酷变身毒液！实测通义Wan2.1首尾帧视频模型，还能“拼接”经典梗图

在GitHub狂揽1w+星标的通义万相Wan2.1，又双叒上新了！

来自主题: AI技术研报

5392 点击 2025-04-19 17:20

ControlNet作者再封神！6GB显存直出「兔八哥」动画，开源一夜获2k+星

只用6GB显存的笔记本GPU，就能生成流畅的高质量视频！斯坦福研究团队重磅推出FramePack，大幅改善了视频生成中的遗忘和漂移难题。

来自主题: AI技术研报

5368 点击 2025-04-19 17:05