AI资讯新闻榜单内容搜索-A

超越MLA！新架构MLRA百万token，解码最高2.8倍速 | ICLR'26

MLRA通过拆分KV缓存为四个并行分支，显著降低显存占用并实现4路张量并行。推理速度比MLA最高快2.8倍，支持百万级上下文，且模型质量更优。无需牺牲性能，即可高效扩展长文本处理能力。

来自主题: AI技术研报

10320 点击 2026-03-19 15:25

谷歌DeepMind刚刚为Gemini API放了一个大招：内置工具和自定义函数终于可以在同一次调用里混着用了。再加上跨工具的「上下文环流」和Google Maps原生接入，Agent开发的编排噩梦正在终结。

来自主题: AI资讯

6990 点击 2026-03-19 15:23

OpenAI 发起全新挑战：你，准备好迎战了吗？

来自主题: AI资讯

5751 点击 2026-03-19 15:23

理想智驾“黄金一代”集体转向具身智能赛道。

来自主题: AI资讯

9244 点击 2026-03-19 15:22

本文是北京大学彭宇新教授团队在文本生成视频领域的最新研究成果，相关论文已被 CVPR 2026 接收。

来自主题: AI技术研报

8054 点击 2026-03-19 15:22

上周，除了 OpenClaw，AI 圈还有个词越来越火🔥。

来自主题: AI技术研报

9717 点击 2026-03-19 15:20

在大模型时代，Tool-Use已经成为智能体能力的核心组成部分。

来自主题: AI技术研报

7819 点击 2026-03-19 15:17

过去两年，世界模型（World Model）正在成为大模型演进的重要方向。

来自主题: AI技术研报

9561 点击 2026-03-19 15:17

来自天工AI的SkyReels-V4，没打招呼，直接登顶Artificial Analysis文转视频（含音频）全球榜，超越Veo 3.1、Sora 2。一个月前，其Preview版本才刚拿下该榜全球第2。

来自主题: AI资讯

8322 点击 2026-03-19 11:52

我们需要的是一个 AI 工具，还是一个 AI 同事？

来自主题: AI资讯

7499 点击 2026-03-19 10:52