AI资讯新闻榜单内容搜索-SGLang

首个开源实现100%可复现的稳定RL训练框架来了！2次结果完全重合

开源框架实现100%可复现的稳定RL训练！下图是基于Qwen3-8B进行的重复实验。两次运行，一条曲线，实现了结果的完美重合，为需要高精度复现的实验场景提供了可靠保障。这就是SGLang团队联合slime团队的最新开源成果。

来自主题: AI技术研报

6296 点击 2025-09-27 10:19

专门适用超大模型、带来2.18倍推理加速，最新投机采样训练框架开源！ SGLang团队联合美团搜推平台、Cloudsway.AI开源SpecForge。

来自主题: AI资讯

7248 点击 2025-07-27 13:22

MiniMax 在 7 月 10 日面向全球举办了 M1 技术研讨会，邀请了来自香港科技大学、滑铁卢大学、Anthropic、Hugging Face、SGLang、vLLM、RL领域的研究者及业界嘉宾，就模型架构创新、RL训练、长上下文应用等领域进行了深入的探讨。

来自主题: AI资讯

7605 点击 2025-07-20 12:37

近日，来自SGLang、英伟达等机构的联合团队发了一篇万字技术报告：短短4个月，他们就让DeepSeek-R1在H100上的性能提升了26倍，吞吐量已非常接近DeepSeek官博数据！

来自主题: AI技术研报

10392 点击 2025-05-09 12:55

用来运行 Llama 3 405B 优势明显。

来自主题: AI技术研报

8808 点击 2024-07-27 19:22