原作亲自下场!Mistral首款开源7B Mamba模型「埃及艳后」效果惊艳
原作亲自下场!Mistral首款开源7B Mamba模型「埃及艳后」效果惊艳最近,7B小模型又成为了AI巨头们竞相追赶的潮流。继谷歌的Gemma2 7B后,Mistral今天又发布了两个7B模型,分别是针对STEM学科的Mathstral,以及使用Mamaba架构的代码模型Codestral Mamba。
来自主题: AI技术研报
10667 点击 2024-07-17 19:53
搜索
最近,7B小模型又成为了AI巨头们竞相追赶的潮流。继谷歌的Gemma2 7B后,Mistral今天又发布了两个7B模型,分别是针对STEM学科的Mathstral,以及使用Mamaba架构的代码模型Codestral Mamba。
13.8和13.11哪个大?这个问题不光难倒了部分人类,还让一票大模型折戟。AI如今都能做AI奥数题了,但简单的常识问题对它们依然难如登天。其实,无论是比大小,还是卷心菜难题,都揭示了LLM在token预测上的一个重大缺陷。
视频生成也能参考“上下文”?!
AI侵权又来了……
“欧洲OpenAI”和“Transformer挑战者”强强联合了!
专为大学生搞科研的大模型,来了。
AI是第三次计算革命,而中国是最佳的孵化地。
在智能手表AI化这件事上,如何平衡同样将非常重要。
你有大模型选型焦虑吗?
大模型理解、推理Excel,现在变得更加精准了。