AI资讯新闻榜单内容搜索-LLaMA

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLaMA

早期项目｜硅谷初创公司「Aizip」创建小语言模型Gizmo，应用于边缘市场

早期项目｜硅谷初创公司「Aizip」创建小语言模型Gizmo，应用于边缘市场

早期项目｜硅谷初创公司「Aizip」创建小语言模型Gizmo，应用于边缘市场

从前两年的百模大战到大语言模型 LLM（Large Language Model）的逐步落地应用，端侧AI始终是人工智能技术发展中至关重要的一环。所谓的端侧AI，即用户在使用过程中不依赖云服务器，直接在终端设备本地使用AI服务。相比于ChatGPT4.0和最新推出的Llama3.1等依赖于云端接口的主流大语言模型，设备端边缘应用的紧凑模型有较强的私密性，也具有个性化操作和节省成本等诸多优势。

来自主题: AI资讯

7447 点击 2024-08-05 15:45

小扎自曝砸重金训Llama 4，24万块GPU齐发力！预计2025年发布

小扎自曝砸重金训Llama 4，24万块GPU齐发力！预计2025年发布

小扎自曝砸重金训Llama 4，24万块GPU齐发力！预计2025年发布

Llama 3.1刚发布不久，Llama 4已完全投入训练中。这几天，小扎在二季度财报会上称，Meta将用Llama 3的十倍计算量，训练下一代多模态Llama 4，预计在2025年发布。

来自主题: AI技术研报

7289 点击 2024-08-05 15:25

70倍极致压缩！大模型的检查点再多也不怕

70倍极致压缩！大模型的检查点再多也不怕

70倍极致压缩！大模型的检查点再多也不怕

大模型作为当下 AI 工业界和学术界当之无愧的「流量之王」，吸引了大批学者和企业投入资源去研究与训练。随着规模越做越大，系统和工程问题已经成了大模型训练中绕不开的难题。例如在 Llama3.1 54 天的训练里，系统会崩溃 466 次，平均 2.78 小时一次！

来自主题: AI技术研报

8253 点击 2024-08-05 14:04

Meta的Llama 3是合成数据训练？数据荒了解一下

Meta的Llama 3是合成数据训练？数据荒了解一下

Meta的Llama 3是合成数据训练？数据荒了解一下

如今一场席卷人工智能圈的“石油危机”已经出现，几乎每一家AI厂商都在竭力寻求新的语料来源，但再多的数据似乎也填不满AI大模型的胃口。更何况越来越多的内容平台意识到了手中数据的价值，纷纷开始敝帚自珍。为此，“合成数据”也成为了整个AI行业探索的新方向。

来自主题: AI资讯

7260 点击 2024-08-05 12:23

DeepMind研究成本大起底，一篇ICML论文烧掉1290万美元

DeepMind研究成本大起底，一篇ICML论文烧掉1290万美元

DeepMind研究成本大起底，一篇ICML论文烧掉1290万美元

DeepMind最近被ICML 2024接收的一篇论文，完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本，大概是Llama 3预训练的15%，耗费资金可达12.9M美元。

来自主题: AI技术研报

7473 点击 2024-08-03 15:03

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住了

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住了

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住了

Llama 3.1 刚刚发布，你是否已经尝试了呢？就算你的个人计算机是最近的顶尖配置，运行其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。

来自主题: AI技术研报

8245 点击 2024-08-02 16:07

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！

来自主题: AI技术研报

9863 点击 2024-08-02 14:26

【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

不同类型的数据配比如何配置:先通过小规模实验确定最优配比，然后将其应用到大模型的训练中。 Token配比结论：通用知识50%；数学与逻辑25%；代码17%；多语言8%。

来自主题: AI技术研报

8282 点击 2024-08-02 11:53

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑千亿参数大模型？

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑千亿参数大模型？

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑千亿参数大模型？

是时候用CPU通用服务器跑千亿参数大模型了！

来自主题: AI资讯

7470 点击 2024-08-01 16:19

大模型行业，根本没有什么“真”开源？

大模型行业，根本没有什么“真”开源？

大模型行业，根本没有什么“真”开源？

最近一段时间开源大模型市场非常热闹，先是苹果开源了70亿参数小模型DCLM，然后是重量级的Meta的Llama 3.1 和Mistral Large 2相继开源，在多项基准测试中Llama 3.1超过了闭源SOTA模型。不过开源派和闭源派之间的争论并没有停下来的迹象。

来自主题: AI资讯

6601 点击 2024-08-01 11:26

上一页当前第14页,共38页下一页