AI资讯新闻榜单内容搜索-LLM

小学二年级数学水平，跟着这篇博客也能理解LLM运行原理

最近，Meta Gen AI 部门的数据科学总监 Rohit Patel 听到了你的心声。他用加法和乘法 —— 小学二年级的数学知识，深入浅出地解析了大模型的基础原理。

来自主题: AI资讯

6134 点击 2024-11-25 15:24

Hugging Face 上的模型数量已经超过了 100 万。但是几乎每个模型都是孤立的，难以与其它模型沟通。尽管有些研究者甚至娱乐播主试过让 LLM 互相交流，但所用的方法大都比较简单。

来自主题: AI技术研报

5903 点击 2024-11-25 14:46

在当今人工智能迅猛发展的时代，大语言模型（LLMs）已成为众多AI应用的核心引擎。然而，来自ETH Zurich和Google DeepMind的一项最新研究揭示了一个令人深思的现象：这些看似强大的模型存在着严重的“盲从效应”。

来自主题: AI技术研报

6302 点击 2024-11-25 09:44

我们对小型语言模型的增强方法、已存在的小模型、应用、与 LLMs 的协作、以及可信赖性方面进行了详细调查。

来自主题: AI技术研报

6946 点击 2024-11-24 20:02

在多模态AI领域，基于预训练视觉编码器与MLLM的方法（如LLaVA系列）在视觉理解任务上展现出卓越性能。

来自主题: AI技术研报

9324 点击 2024-11-22 15:54

Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型，能够理解和生成语音及文本，可以非常自然地在两种模式间转换，不仅能处理基本的语音转文本和文本转语音任务，还能捕捉和再现语音中的情感和风格。

来自主题: AI技术研报

7182 点击 2024-11-22 14:41

Scaling Law撞墙，扩展语言智能体的推理时计算实在太难了！破局之道，竟是使用LLM作为世界模型？OSU华人团队发现，使用GPT-4o作为世界模型来支持复杂环境中的规划，潜力巨大。

来自主题: AI技术研报

6443 点击 2024-11-22 13:38

今年 4 月，AI 领域大牛 Karpathy 一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」曾经引发机器学习社区的热烈讨论。

来自主题: AI资讯

6687 点击 2024-11-22 10:18

随着开源数据的日益丰富以及算力价格的持续下降，对于个人或小型机构而言，预训练一个小型的 LLM 已逐渐成为可能。开源中文预训练语言模型 Steel - LLM 就是一个典型案例，其模型参数量与数据量并非十分庞大，基本处于参数量为 B 级别、数据量为 T 级别的规模。

来自主题: AI技术研报

8213 点击 2024-11-22 09:44

在「全球最难LLM评测榜单」上，国产万亿参数模型杀入全球第五，拿下中国第一！国内明星初创阶跃星辰的这个自研模型太过亮眼，甚至引起了外国网友的热议。

来自主题: AI资讯

6679 点击 2024-11-21 13:59