AI资讯新闻榜单内容搜索-Dynamo

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Dynamo

榨干GPU性能，中兴Mariana（马里亚纳）突破显存壁垒

当大语言模型（LLM）走向千行百业，推理效率与显存成本的矛盾日益尖锐。

来自主题: AI资讯

8232 点击 2025-08-26 19:21

Buddy Compiler 端到端 LLaMA2-7B 推理示例已经合并到 buddy-mlir仓库[1]主线。我们在 Buddy Compiler 的前端部分实现了面向 TorchDynamo 的第三方编译器，从而结合了 MLIR 和 PyTorch 的编译生态。

来自主题: AI技术研报

6899 点击 2023-11-23 20:33