AI资讯新闻榜单内容搜索-MOE模型

150B token从头训练，普林斯顿Meta发布完全可微MoE架构Lory

前几天，普林斯顿大学联合Meta在arXiv上发表了他们最新的研究成果——Lory模型，论文提出构建完全可微的MoE模型，是一种预训练自回归语言模型的新方法。

来自主题: AI技术研报

10716 点击 2024-05-20 16:10

开源大模型领域，又迎来一位强有力的竞争者。

来自主题: AI技术研报

11823 点击 2024-05-07 18:24

就在刚刚，拥有128位专家和4800亿参数的Arctic，成功登上了迄今最大开源MoE模型的宝座。

来自主题: AI技术研报

11372 点击 2024-04-25 19:53

Snowflake 发布高「企业智能」模型 Arctic，专注于企业内部应用。

来自主题: AI技术研报

8736 点击 2024-04-25 19:28

一条磁力链，Mistral AI又来闷声不响搞事情。

来自主题: AI资讯

7010 点击 2024-04-11 16:39

“只需”10万美元，训练Llama-2级别的大模型。尺寸更小但性能不减的MoE模型来了：它叫JetMoE，来自MIT、普林斯顿等研究机构。性能妥妥超过同等规模的Llama-2。

来自主题: AI技术研报

8843 点击 2024-04-05 17:13

一年一度的CVPR 2024录用结果出炉了。今年，共有2719篇论文被接收，录用率为23.6%。

来自主题: AI技术研报

9254 点击 2024-04-05 16:09

混合专家（MoE）架构已支持多模态大模型，开发者终于不用卷参数量了！北大联合中山大学、腾讯等机构推出的新模型MoE-LLaVA，登上了GitHub热榜。

来自主题: AI技术研报

5308 点击 2024-02-09 13:54

「高端」的开源，往往采用最朴素的发布方式。昨天，Mistral AI 在 X 平台甩出一条磁力链接，宣布了新的开源动作。

来自主题: AI资讯

9891 点击 2023-12-10 14:35