AI资讯新闻榜单内容搜索-SGLang

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: SGLang
速递|Boson AI × SGLang 发布 Higgs Audio v3 TTS:让语音智能体实时可控

速递|Boson AI × SGLang 发布 Higgs Audio v3 TTS:让语音智能体实时可控

速递|Boson AI × SGLang 发布 Higgs Audio v3 TTS:让语音智能体实时可控

Boson AI 与 SGLang-Omni 团队宣布,SGLang-Omni 已完成对 Higgs Audio v3 TTS 的端到端 Serving 支持。作为一家成立于 2023 年的 AI 基础设施公司,李沐与 Alex Smola共同创立了 Boson AI,聚焦大模型时代的系统与基础设施创新。

来自主题: AI资讯
7635 点击    2026-06-06 10:18
老黄喝豆汁「破防」背后,国产GPU正在填上CUDA护城河

老黄喝豆汁「破防」背后,国产GPU正在填上CUDA护城河

老黄喝豆汁「破防」背后,国产GPU正在填上CUDA护城河

老黄在北京喝豆汁「翻车」,全网笑疯了。但真正值得警惕的,是他背后那个正在长出来的「中国版CUDA生态」。从万卡集群到机器狗,从SGLang主线到AI Agent自动迁移,这家公司这次不只是秀芯片,而是在重写国产GPU的游戏规则!

来自主题: AI资讯
9673 点击    2026-05-20 15:15
拿下1亿美元种子轮!SGLang团队创立RadixArk,打造下一代开放AI基础设施

拿下1亿美元种子轮!SGLang团队创立RadixArk,打造下一代开放AI基础设施

拿下1亿美元种子轮!SGLang团队创立RadixArk,打造下一代开放AI基础设施

AI 基础设施初创公司 RadixArk 宣布完成 1 亿美元种子轮融资,投后估值 4 亿美元。无论金额、估值还是投资人阵容,这都是 2026 年 AI Infra 赛道中目前最重的一笔早期下注。

来自主题: AI资讯
9781 点击    2026-05-09 08:29
致敬Kimi K2:基于slime的全流程INT4量化感知RL训练

致敬Kimi K2:基于slime的全流程INT4量化感知RL训练

致敬Kimi K2:基于slime的全流程INT4量化感知RL训练

受 Kimi K2 团队启发,SGLang RL 团队成功落地了 INT4 量化感知训练(QAT) 流程方案。通过 “训练端伪量化 + 推理端真实量化(W4A16)” 的方案组合,我们实现了媲美 BF16 全精度训练的稳定性与训推一致性,

来自主题: AI技术研报
7442 点击    2026-02-04 16:32
7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA

7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA

7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA

,时长 00:20 视频 1:单样例推理速度对比:SGLang 部署的 Qwen3-8B (NVIDIA) vs. LoPA-Dist 部署 (NVIDIA & Ascend)(注:NVIDIA 平台

来自主题: AI技术研报
8714 点击    2026-01-01 10:09
SGLang Diffusion震撼发布:图像视频生成速度猛提57%!

SGLang Diffusion震撼发布:图像视频生成速度猛提57%!

SGLang Diffusion震撼发布:图像视频生成速度猛提57%!

就在一周前,全宇宙最火爆的推理框架 SGLang 官宣支持了 Diffusion 模型,好评如潮。团队成员将原本在大语言模型推理中表现突出的高性能调度与内核优化,扩展到图像与视频扩散模型上,相较于先前的视频和图像生成框架,速度提升最高可达 57%:

来自主题: AI技术研报
8825 点击    2025-11-22 11:33
首个开源实现100%可复现的稳定RL训练框架来了!2次结果完全重合

首个开源实现100%可复现的稳定RL训练框架来了!2次结果完全重合

首个开源实现100%可复现的稳定RL训练框架来了!2次结果完全重合

开源框架实现100%可复现的稳定RL训练!下图是基于Qwen3-8B进行的重复实验。两次运行,一条曲线,实现了结果的完美重合,为需要高精度复现的实验场景提供了可靠保障。这就是SGLang团队联合slime团队的最新开源成果。

来自主题: AI技术研报
7907 点击    2025-09-27 10:19