AI资讯新闻榜单内容搜索-清华

UIUC清华微软联合提出PlugMem：当Agent记忆告别「经历」，开始存储「经验」

随着大语言模型 Agent 开始在对话、问答与复杂交互环境中长期运行，“记忆该如何设计” 正在成为一个绕不开的核心问题。

来自主题: AI技术研报

9464 点击 2026-03-12 09:53

CVPR 2026｜清华联合美团推出3DThinker，首个用3D意象思考的工作

大家是否有这样的感觉？给定几张场景中拍摄的图片，往往能够在脑海中想象出这个场景的三维布局，然而当前的多模态大模型还停留于纯文本或者 2D 视觉的推理表示，限制了图像中隐含几何结构的表达能力。

来自主题: AI技术研报

8208 点击 2026-03-11 09:25

如何训练VLA？丰田研究院发布史上最大实验规模「保姆级」教程

是不是经常纠结于 VLA（视觉 - 语言 - 动作）模型的训练技巧？面对层出不穷的 VLA 算法，是不是常常感到眼花缭乱，不知道哪种数据模态、训练策略最有效？别急，丰田研究院（TRI）和清华大学刚刚

来自主题: AI技术研报

8357 点击 2026-03-08 10:38

清华90后学霸造Agent，完成百万美金天使融资丨亿欧首发

AI 本质不是工具升级，而是生产关系的重塑。

来自主题: AI资讯

7069 点击 2026-03-06 10:11

为什么BF16的FlashAttention会把训练「炸掉」？清华首次给出机制解释，用极简改动稳住训练

一句话总结：社区里困扰了多年的一个 “玄学” 现象终于被拆解清楚了：在 BF16 等低精度训练里，FlashAttention 不是随机出 bug，而是会在特定条件下触发有方向的数值偏置，借助注意力中涌现的相似低秩更新方向被持续放大，最终把权重谱范数和激活推到失控，导致 loss 突然爆炸。论文还给出一个几乎不改模型、只在 safe softmax 里做的极小修改，实测能显著稳定训练。

来自主题: AI技术研报

6059 点击 2026-03-04 13:49

字节清华智能体自动写CUDA内核，比torch.compile加速2.11倍

让AI自己写高性能GPU代码，字节Seed与清华AIR团队做到了。

来自主题: AI技术研报

7346 点击 2026-03-04 10:39

再携手！清华陈建宇×斯坦福Chelsea团队发布VLAW，世界模型×VLA协同进化

机器之心编辑部整个具身智能领域都在探索世界模型的实用化路径。这个被寄予厚望的「数字模拟器」，本应成为机器人训练的核心工具，却因物理保真度低等问题成为「空中楼阁」。去年年中，谷歌发布了 Genie-

来自主题: AI资讯

9357 点击 2026-02-28 19:48

全球最大游戏博主「偷师」DeepSeek，爆改国产大模型干翻 ChatGPT

全球最大游戏博主 PewDiePie，又整活了。他靠着「偷师」DeepSeek、清华大学发布的技术文档，用一堆魔改显卡成功微调出一个自己的 AI 模型，而这个模型在编程基准测试中的表现，竟然超越了 GPT-4 和 Gemini 2.5 Pro。

来自主题: AI资讯

8201 点击 2026-02-28 15:34

DeepSeek新论文来了！联手清华、北大，优化智能体大模型推理

「DeepSeek V4 来了！」这样的消息是不是已经听烦了？总结来说，这篇新论文介绍了一个名为「DualPath」的创新推理系统，专门针对智能体工作负载下的大语言模型（LLM）推理性能进行优化。具体来讲，通过引入「双路径 KV-Cache 加载」机制，解决了在预填充 - 解码（PD）分离架构下，KV-Cache 读取负载不平衡的问题。

来自主题: AI技术研报

8419 点击 2026-02-27 11:35

清华数学系大神跳槽OpenAI！曾主导SAM与Llama开发，Sora负责人：欢迎加入

刚刚，毕业清华大学数学系，曾在Meta FAIR工作3.75年、主导过SAM与Llama多项核心工作的研究员张鹏川（Pengchuan Zhang）宣布离职。他的下一站，是来到OpenAI，投身于世界模拟与机器人学（World Simulation and Robotics）方向的研究。

来自主题: AI资讯

9844 点击 2026-02-25 14:57