AI资讯新闻榜单内容搜索-合成数据

红杉资本对话Harmonic联创：数学即推理，合成数据是模型的新燃料，计算资源和自博弈是进步的关键

数学界对AI在数学中应用的看法存在分歧，但年轻一代更支持AI和验证工具。Vlad指出，通过递归自我改进，AI有潜力在数学和其他复杂问题上取得重大突破。随着AI在模式识别和自我改进方面的进步，它可能参与解决大型数学难题，如黎曼猜想。同时，数学家仍将在引导AI方向、规划研究领域和解释结果方面起关键作用。

来自主题: AI资讯

8987 点击 2024-10-19 14:48

大模型合成数据机理分析，人大刘勇团队：信息增益影响泛化能力

在大语言模型（LLMs）后训练任务中，由于高质量的特定领域数据十分稀缺，合成数据已成为重要资源。虽然已有多种方法被用于生成合成数据，但合成数据的理论理解仍存在缺口。为了解决这一问题，本文首先对当前流行的合成数据生成过程进行了数学建模。

来自主题: AI技术研报

7617 点击 2024-10-15 18:38

大模型「强崩溃」！Meta新作：合成数据有「剧毒」，1%即成LLM杀手

1%的合成数据，就让LLM完全崩溃了？ 7月，登上Nature封面一篇论文证实，用合成数据训练模型就相当于「近亲繁殖」，9次迭代后就会让模型原地崩溃。

来自主题: AI技术研报

5641 点击 2024-10-14 10:12

斯坦福重磅，突破小规模语料瓶颈，EntiGraph合成数据增强算法让LLM更聪明

如何处理小众数据，如何让这些模型高效地学习专业领域的知识，一直是一个挑战。斯坦福大学的研究团队最近提出了一种名为EntiGraph的合成数据增强算法，为这个问题带来了新的解决思路。

来自主题: AI资讯

8075 点击 2024-09-20 10:31

LLM的范式转移：RL带来新的 Scaling Law

从几周前 Sam Altman 在 X 上发布草莓照片开始，整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道，Strawberry 就是之前的 Q-star，其合成数据的方法会大幅提升 LLM 的智能推理能力，尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上，帮助 OpenAI 新一代 Orion。

来自主题: AI资讯

8986 点击 2024-08-31 11:19