AI资讯新闻榜单内容搜索-训练

DeepMind研究成本大起底，一篇ICML论文烧掉1290万美元

DeepMind最近被ICML 2024接收的一篇论文，完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本，大概是Llama 3预训练的15%，耗费资金可达12.9M美元。

来自主题: AI技术研报

8364 点击 2024-08-03 15:03

大模型展现出了卓越的指令跟从和任务泛化的能力，这种独特的能力源自 LLMs 在训练中使用了指令跟随数据以及人类反馈强化学习（RLHF）。

来自主题: AI技术研报

11027 点击 2024-08-03 14:29

大语言模型 (LLM) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？

来自主题: AI技术研报

10196 点击 2024-08-03 14:25

在这篇文章中，笔者将讨论以下几个问题： • 什么是语义路由 • RAG 路由的不同场景

来自主题: AI技术研报

10107 点击 2024-08-03 11:05

在这篇文章中，笔者将讨论以下几个问题： • 为什么要进行 query 理解 • query 理解有哪些技术（从 RAG 角度） • 各种 query 理解技术的实现（基于 LangChain）

来自主题: AI技术研报

12316 点击 2024-08-03 10:57

在本篇文章中，笔者将讨论以下几个问题： • 向量模型在 RAG 系统中的作用有哪些性能不错的向量模型（从 RAG 角度）不同向量模型的评测基准 MTEB 业务中选择向量模型有哪些考量如何 Finetune 向量模型

来自主题: AI技术研报

13789 点击 2024-08-03 10:44

灵活评估任意系统，轻松添加实验工具。

来自主题: AI资讯

3959 点击 2024-08-03 09:21

『RAG 高效应用指南』系列将就如何提高 RAG 系统性能进行深入探讨，提供一系列具体的方法和建议。同时读者也需要记住，提高 RAG 系统性能是一个持续的过程，需要不断地评估、优化和迭代。

来自主题: AI技术研报

12429 点击 2024-08-02 17:11

Llama 3.1 刚刚发布，你是否已经尝试了呢？就算你的个人计算机是最近的顶尖配置，运行其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。

来自主题: AI技术研报

9917 点击 2024-08-02 16:07

7月上旬，多位在字节跳动旗下免费阅读平台番茄小说更新作品的网络文学作者，收到了后台系统发送的“AI训练补充协议”签署提醒。其中提到，一旦签署，其作品内容及相关信息，将被用于平台AI模型训练或其他技术研发应用场景。

来自主题: AI资讯

11834 点击 2024-08-02 15:03