AI技术研报-这里有最前沿的人工智能技术解读

刷榜多元时序预测，性能波动0%！打破CI/CD二元对立 | ICLR'26

ICLR'26新研究CPiRi打破时序预测僵局：用冻结底座提取时序特征，轻量模块专注学习通道间真实关系，不靠位置编码「背答案」。测试中通道乱序性能零波动，仅用25%数据即可泛化至全网络，真正实现鲁棒与精准双赢。

来自主题: AI技术研报

7802 点击 2026-03-26 10:50

OpenAI重磅揭秘：你认为的AI幻觉，可能是模型故意出错

你以为AI答错就一定是幻觉？不，它也可能是在故意骗你。

来自主题: AI技术研报

9975 点击 2026-03-26 10:50

「百万级」视频推理数据集！30+顶尖高校联合发布

AI视频生成已能「画得像」，但不会「想得对」。VBVR推出百万级视频推理数据集，首次系统评测模型对空间、物理、逻辑和抽象的推理能力，发现顶尖模型通过率仅68%，暴露其缺乏真实认知，推动视频AI从「视觉模仿」迈向「智能推理」。

来自主题: AI技术研报

6994 点击 2026-03-26 10:49

零样本 Sim-to-Real ！实现五指灵巧手力控抓取与手内操作

实现具备人类水平的灵巧操作能力，是机器人学领域长期以来的核心挑战之一。尽管多指灵巧手在硬件上具备了类似人类的潜力，但由于接触丰富的物理特性和非理想的驱动机制，训练能够直接部署在真实硬件上的控制策略仍然非常困难。

来自主题: AI技术研报

6797 点击 2026-03-26 10:48

VLA别再「走神」：即插即用提升视觉泛化，相对Pi0.5提升18%

“把水果放进盘子里”——机器人看懂了指令，开始执行，却在最后关头抓偏了。

来自主题: AI技术研报

6624 点击 2026-03-26 10:48

用SFT打出RL的效果？微软联合提出高效后训练算法

在大模型后训练阶段，监督微调（SFT）和强化学习（RL）是两根不可或缺的支柱。SFT 利用高质量的离线（Off-policy）数据快速注入知识，但受限于静态数据分布，泛化能力往往容易触及天花板并带来灾难性遗忘；RL 则允许模型在探索中不断自我迭代，产生与当前策略同分布（On-policy）的数据，上限极高，但往往伴随着训练极度不稳定、计算资源消耗巨大的痛点。

来自主题: AI技术研报

6212 点击 2026-03-26 10:47

突发｜立即检查你的Python库！LiteLLM被投毒，Karpathy警告，马斯克关注

这是一件极其严肃的软件安全事件。

来自主题: AI技术研报

6281 点击 2026-03-25 14:21

Sand.ai开源发布MagiCompiler：突破局部编译界限，定义训推性能上限

大模型开发者常面临一个两难选择：要速度，还是省显存？

来自主题: AI技术研报

7069 点击 2026-03-25 14:17

OpenClaw代码越改越崩？新研究EvoClaw揭示：Agents持续开发成功率仅13.37%

到2025年末，AI编程已经全面从辅助工具Copilot，转向以AI为主、人类监督的Agent时代。

来自主题: AI技术研报

6259 点击 2026-03-25 13:42

对抗KV Cache压缩的脆弱性：两行代码以最坏风险控制防御底层假设崩塌

随着大模型长上下文能力快速增长，海量 KV Cache 存储需求急剧增加，各类 KV Cache 压缩方法如雨后春笋般涌现。然而，这些方案在真实场景中的工程落地却常常陷入困境。

来自主题: AI技术研报

9552 点击 2026-03-25 13:41

Ψ₀刚刚开源了！迈向通用人形机器人的基座模型

人形机器人在春晚舞台上大放异彩！然而，人们在看惯了机器人跳舞、后空翻，乃至武术表演之后，不禁开始思考：机器人何时才能真正走进大众生活，解决日常生活中的琐碎任务，从而解放人类的双手？

来自主题: AI技术研报

8262 点击 2026-03-25 13:40

Karpathy刚开源的autoresearch，我拿来优化龙虾skill，成功率从56%飙到92%

养了这么久的虾，你应该能发现，skills有多重要了。

来自主题: AI技术研报

7507 点击 2026-03-25 10:42

世界模型开始做减法？LeCun团队和清华团队给出两种思路

近期，围绕「世界模型」这一方向，有两项工作受到较多关注。

来自主题: AI技术研报

6383 点击 2026-03-25 10:14

LeCun的世界模型单GPU就能跑了

LeCun世界模型最新进展，开源了一套极简训练方案，单GPU就能跑。

来自主题: AI技术研报

7763 点击 2026-03-24 17:25

ICLR 2026 | ESC — 解构一步生成，厘清细节，探寻本质

近期，基于捷径化概率流路径（shortcut probability flow trajectory）并从头训练的一步扩散生成模型，展现出强大的实证有效性。然而，这类方法的提出通常建立在较为复杂的理论推导之上，并且往往与具体实现细节高度耦合。这带来一个直接的问题：究竟哪些设计是方法成立的本质要素，哪些又只是可以灵活替换的实现组件。

来自主题: AI技术研报

7783 点击 2026-03-24 17:19

Sand.ai重磅更新MagiAttention，正在定义分布式Attention性能新标杆

2025 年 4 月，Sand.ai 开源了 MagiAttention v1.0.0，定义了下一代分布式 Attention 的全新设计和系统框架。历经一年的深耕，今天 Sand.ai 正式发布：MagiAttention v1.1.0，以更成熟的原生算子组件，重新定义 Hopper 与 Blackwell 两代架构分布式 Attention 的性能上限。

来自主题: AI技术研报

7073 点击 2026-03-24 16:31