
颜水成袁粒提出新一代MoE架构:专家吞吐速度最高提升2.1倍!
颜水成袁粒提出新一代MoE架构:专家吞吐速度最高提升2.1倍!比传统MoE推理速度更快、性能更高的新一代架构,来了! 这个通用架构叫做MoE++,由颜水成领衔的昆仑万维2050研究院与北大袁粒团队联合提出。
来自主题: AI技术研报
3364 点击 2024-10-21 11:22
比传统MoE推理速度更快、性能更高的新一代架构,来了! 这个通用架构叫做MoE++,由颜水成领衔的昆仑万维2050研究院与北大袁粒团队联合提出。