仅需15%全量Attention!「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了 仅需15%全量Attention!「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了 关键词: AI,模型训练,RTPurbo,Qwen3 为什么大模型厂商给了 128K 的上下文窗口,却在计费上让长文本显著更贵? 来自主题: AI技术研报 6816 点击 2025-12-24 10:07