AI资讯新闻榜单内容搜索-端侧部署

0.3B参数，600MB内存！腾讯混元实现产业级2Bit量化，端侧模型小如手机App

等效参数量仅0.3B，内存占用仅600MB，更适合端侧部署还带思维链的模型来了。腾讯混元最新推出面向消费级硬件场景的“极小”模型HY-1.8B-2Bit，体量甚至比常用的一些手机应用还小。

来自主题: AI技术研报

5899 点击 2026-02-10 14:28

华为开源7B多模态模型，视觉定位和OCR能力出色，你的昇腾端侧“新甜点”来了

7B量级模型，向来是端侧部署与个人开发者的心头好。

来自主题: AI技术研报

6692 点击 2026-01-05 14:30

华为中科大联创大模型低比特量化算法，1‰数据实现昇腾无损压缩7倍

大模型巨无霸体量，让端侧部署望而却步？华为联手中科大提出CBQ新方案，仅用0.1%的训练数据实现7倍压缩率，保留99%精度。

来自主题: AI技术研报

9412 点击 2025-05-26 15:21

ICML 2025 Spotlight｜华为诺亚提出端侧大模型新架构MoLE，内存搬运代价降低1000倍

Mixture-of-Experts（MoE）在推理时仅激活每个 token 所需的一小部分专家，凭借其稀疏激活的特点，已成为当前 LLM 中的主流架构。然而，MoE 虽然显著降低了推理时的计算量，但整体参数规模依然大于同等性能的 Dense 模型，因此在显存资源极为受限的端侧部署场景中，仍然面临较大挑战。

来自主题: AI技术研报

7611 点击 2025-05-07 09:30