推理提速4倍!莫纳什、浙大提出动态拼接,大小模型智能协作 推理提速4倍!莫纳什、浙大提出动态拼接,大小模型智能协作 关键词: AI,R-Stitch,思维链,模型训练 针对「大模型推理速度慢,生成token高延迟」的难题,莫纳什、北航、浙大等提出R-Stitch框架,通过大小模型动态协作,衡量任务风险后灵活选择:简单任务用小模型,关键部分用大模型。实验显示推理速度提升最高4倍,同时保证高准确率。 来自主题: AI技术研报 5512 点击 2025-10-18 12:21