最佳开源模型刷新多项SOTA,首次超越Mixtral Instruct!「开源版GPT-4」家族迎来大爆发
最佳开源模型刷新多项SOTA,首次超越Mixtral Instruct!「开源版GPT-4」家族迎来大爆发Mixtral 8x7B模型开源后,AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-Hermes 2 Mixtral 8x7B,在主流基准测试中击败了Mixtral Instruct。
搜索
Mixtral 8x7B模型开源后,AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-Hermes 2 Mixtral 8x7B,在主流基准测试中击败了Mixtral Instruct。
今天,小扎正式宣战「开源AGI」!下一代大模型Llama 3正在训练,年底将拥有35万块H100,届时算力总和达60万块H100。为了追赶OpenAI,成立十年的FAIR团队纳入GenAI,全力奔赴AGI。
2023年做大模型,国内更关注的是云厂商,很少有人会注意到,硬件厂商的大模型做得怎么样。
创业8次、数场黑客松、技术迭代的兴奋与失落,就是这一年。
生成式AI这把火在资本市场越烧越旺。根据智东西统计,2023年新晋的生成式AI和大模型领域相关独角兽达23家,国内新晋独角兽有6家,分别是智谱AI、MiniMax、百川智能、零一万物、智元机器人,以及已被收购的光年之外。这些独角兽企业涉及大语言模型、AI视频生成、垂直行业应用研发商以及GPU云服务提供商。
大模型出现后,AI 实现全能个人助理的梦想似乎近在眼前,也有不少公司推出了相应的硬件/软件,比如此前我们介绍的 AI Pin 以及 Rewind。
GPT Store敲响了大模型的App Store时刻
OpenAI、Stability AI、Copilot 均遭起诉,大模型版权如何归属。
现在,为了实现相同的目标,我们有两个最著名的库,即 Haystack 和 LangChain,它们可以帮助我们创建基于大语言模型的端到端应用程序或流程。
对模型参数量的迷信、执念也许可以放下了,混合多个小模型也是未来构造对话型 AI 的一个光明的方向。