AI资讯新闻榜单内容搜索-LLaMA

谷歌开源系模型第二代免费开放！27B媲美LLaMA3 70B，单H100或TPU主机可跑

谷歌开源模型Gemma 2开放了！虽然前段时间Google I/O大会上，Gemma 2开源的消息就已经被放出，但谷歌还留了个小惊喜—— 除27B模型外，还有一个更轻的9B版本。 DeepMind创始人哈萨比斯表示，27B参数规模下，Gemma 2提供了同类模型最强性能，甚至还能与其两倍大的模型竞争。

来自主题: AI技术研报

9612 点击 2024-06-29 00:02

OpenAI服务受限？别担心，来这里丝滑玩转700亿参数Llama3，还有100元券免费薅！

如何无痛玩转Llama 3，这个手把手教程一看就会！80亿参数推理单卡半分钟速成，微调700亿参数仅用4卡近半小时训完，还有100元代金券免费薅。

来自主题: AI资讯

10241 点击 2024-06-26 18:18

00后华裔小哥哈佛辍学组团挑战英伟达，史上最快AI芯片Etched chip推理性能超H100二十倍！

史上最快Transformer芯片诞生了！用 Etched chip 跑Llama 70B，推理性能已超B200十倍，超H100二十倍！刚刚，几位00后小哥从哈佛辍学后成立的公司Etached，宣布再融资1.2亿美元。

来自主题: AI资讯

12398 点击 2024-06-26 17:44

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发布Q*算法

近日，一篇出自中国团队之手的AI论文在外网引发热议。论文中，研究团队提出了Q*模型算法，帮助Llama-2-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，使模型性能迎来惊人提升。

来自主题: AI资讯

12079 点击 2024-06-26 10:57

240万亿巨量数据被洗出，足够训出18个GPT-4！全球23所机构联手，清洗秘籍公开

是时候把数据Scale Down了！Llama 3揭示了这个可怕的事实：数据量从2T增加到15T，就能大力出奇迹，所以要想要有GPT-3到GPT-4的提升，下一代模型至少还要150T的数据。好在，最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了，但你有卡吗？

来自主题: AI技术研报

9890 点击 2024-06-24 15:25

340B险胜70B，Kimi机器人贴脸“嘲讽”英伟达新开源模型

排名超过Llama-3-70B，英伟达Nemotron-4 340B问鼎竞技场最强开源模型！

来自主题: AI资讯

10366 点击 2024-06-20 10:02

8B模型奥数成绩比肩GPT-4！上海AI Lab出品

只要1/200的参数，就能让大模型拥有和GPT-4一样的数学能力？来自复旦和上海AI实验室的研究团队，刚刚研发出了具有超强数学能力的模型。它以Llama 3为基础，参数量只有8B，却在奥赛级别的题目上取得了比肩GPT-4的准确率。

来自主题: AI技术研报

11180 点击 2024-06-17 23:35

大模型+蒙特卡洛树搜索，一招让LLaMa-3 8B奥数水平直逼GPT-4

通过算法层面的创新，未来大语言模型做数学题的水平会不断地提高。

来自主题: AI技术研报

11265 点击 2024-06-17 19:32

英伟达开源3400亿巨兽，98%合成数据训出最强开源通用模型！性能对标GPT-4o

刚刚，英伟达全新发布的开源模型Nemotron-4 340B，有可能彻底改变训练LLM的方式！从此，或许各行各业都不再需要昂贵的真实世界数据集了。而且，Nemotron-4 340B直接超越了Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2，甚至可以和GPT-4掰手腕！

来自主题: AI技术研报

6294 点击 2024-06-15 15:58

又一届「AI春晚」拉开序幕！智源大模型集体爆发了

一年一度的国内「AI 春晚」—— 智源大会又一次拉开了序幕。

来自主题: AI技术研报

10726 点击 2024-06-15 15:45