AI技术研报-这里有最前沿的人工智能技术解读

Thinking Machines 刚发的「边听边说」，让我想到了几个月前的面壁智能

OpenAI 前 CTO Mira Murati 和前应用研究负责人翁荔（Lilian Weng）创立的 Thinking Machines Lab，也就是 TML，刚刚发布了一个叫「Interaction Models」的研究

来自主题: AI技术研报

8696 点击 2026-05-13 10:47

告别云端依赖！字节开源新作DreamLite让手机秒变 AI 画板

近日，字节跳动智能创作部门（Intelligent Creation Lab）提出新作 DreamLite，一个主干网络仅有 0.39B 参数的轻量级统一扩散模型，在单一网络内同时支持文生图（Text-to-Image）和图像编辑（Text-guided Image Editing）两个任务，是目前已知首个实现这一能力的端侧模型。

来自主题: AI技术研报

8811 点击 2026-05-13 10:30

Agent Infra 实践复盘：Kimi 如何搭建 Agent 背后的 Database 服务

Agent 到底需要什么样的 infrastructure，今年业界一直有很多探讨，PingCAP 联合创始人黄东旭此前也发过多篇讨论文章，不过当时都是一些猜想。随着 agent 今年的爆发，大规模落地的案例出现了。

来自主题: AI技术研报

9213 点击 2026-05-13 10:00

TTS也要真人感！首个字级内容、毫秒级停顿控制的语音合成系统

语音合成这两年发展迅速：把一段话顺顺当当地念完，已经不算难事；难的是该慢的时候慢，该顿的时候顿，该强调的时候真能把重点托出来。

来自主题: AI技术研报

5810 点击 2026-05-13 10:00

你的公司在“用AI”，还是真正AI原生？Greg说：全球也就

昨天我在刷X，Greg Isenberg发了一篇长文。133K次浏览，598个赞，说的是"如何成为AI原生公司"。我读到第三段停下来了。

来自主题: AI技术研报

6387 点击 2026-05-13 09:59

上海AI Lab新研究：SFT能泛化，只要满足这三个条件

随着大模型后训练（Post-training）技术的发展，强化学习（RL）在提升模型推理能力方面的表现备受瞩目。

来自主题: AI技术研报

9300 点击 2026-05-13 09:59

Auto Research最后一块拼图，Frontier-Eng Bench登场，在工程闭环里死磕最优

科研，能被 AI 全程加速吗？

来自主题: AI技术研报

7873 点击 2026-05-12 14:55

翻完五角大楼公开的全部 UFO 档案后，我完整做了一个 Wiki 网站给大家用

这两天，最火的新闻就是美国战争部（五角大楼）把过去几十年的 UFO 档案全部「开源」了。

来自主题: AI技术研报

8272 点击 2026-05-12 14:55

ICLR 2026 Oral｜大模型总爱「想太多」？ DECS从源头消除冗余思考，实现推理token减半且性能不降反升

以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型，通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而，这些模型普遍存在一个核心问题，即过度思考（overthinking）：

来自主题: AI技术研报

6702 点击 2026-05-12 14:31

ICML 2026 | 大模型内部也会长出「情绪树」，规模越大越懂人心

随着语音、视频、多模态能力不断融入大语言模型（LLM），人与 AI 的交互正在越来越接近自然对话。今天的 LLM 不再只是回答问题的工具，也越来越多地出现在教育、客服、陪伴、心理健康等高度依赖情绪理解的场景中。

来自主题: AI技术研报

6379 点击 2026-05-12 14:31

一个框架，重塑具身研发流程：Dexbotic走向具身PyTorch

近日，原力灵机开源的具身智能原生框架 Dexbotic 宣布正式支持以 RLinf 作为其分布式强化学习后端。对具身智能开发者而言，这不仅是一次普通的工程适配，更意味着 VLA 模型研发中长期存在的「SFT 与 RL 割裂」问题，正在被真正打通。

来自主题: AI技术研报

9037 点击 2026-05-12 14:30

打不过AI就加入？他辍学MIT，要把人类意识装进芯片，创造「数字生命」

「我即将离开麻省理工学院，不再继续攻读博士学位。人工智能的发展速度太快，人类已然难以跟上。

来自主题: AI技术研报

9646 点击 2026-05-12 09:34

看完AI御三家泄露的灵魂文件，我发现 GPT 已经迫不及待要卖货了

AI 的熟手玩家，都应该知道system prompt这个词：每一个你用过的 AI 助手，背后都有一份你看不见的文件，却对模型有着决定性的作用。

来自主题: AI技术研报

6864 点击 2026-05-12 08:53

多Agent场景，子agent 之间数据读写不同步，如何解决？

多Agent 系统里，经常会出现一个单 Agent 里从来不会出现的问题：一个子 Agent 刚写完数据，另一个子 Agent 立刻去读，结果是空的。

来自主题: AI技术研报

9535 点击 2026-05-12 08:53

Siggraph 26 | 视频版Vision-Banana来了？大一统框架UniVidX刷新多项视频任务SOTA

近日，由香港科技大学 MMLab 及合作团队完成的研究工作「UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors」被计算机图形学顶级会议 SIGGRAPH 2026 正式接收。

来自主题: AI技术研报

9993 点击 2026-05-12 08:53

刚刚，Claude Mythos打爆AI评测天花板！超指数狂飙，2027奇点加速

就在刚刚，Claude Mythos把评测干「失效」了：METR第一次测不准，AI攻防拐点到了！AI进化已成「外星文明」降临，超越指数增长，2027 AGI奇点正加速撞向人类。

来自主题: AI技术研报

8760 点击 2026-05-11 17:29

这样问DeepSeek，能「偷」到数据？

近日，有网友在 X 上发文称，在使用 DeepSeek 的过程中，如果在输入框内输入以下这一段内容，便可「窃取」到 DeepSeek 的训练数据：仔细看了之后发现，具体是这样的：只要你在输入框输入这一段提示词，DeepSeek 就会「吐出」一轮完整的对话记录，不过这并不是你的历史搜索记录，更像是一份随机的对话记录。

来自主题: AI技术研报

9414 点击 2026-05-11 17:29