AI资讯新闻榜单内容搜索-三模式的大语言模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 三模式的大语言模型

首个三模式大语言模型：4倍token吞吐量，长文本秒级时代要来了？

英伟达提出了全球首个三模式的大语言模型系列，只需简单更改注意力模式 / 掩码，即可在自回归、扩散和自推测解码之间切换。一个模型，三种解码模式，没有额外的草稿模型，没有架构变更。最快的模式 token 吞吐量能提升 4 倍。

来自主题: AI技术研报

9755 点击 2026-05-22 15:33