AI资讯新闻榜单内容搜索-LLMs

震撼！苏黎世联邦理工和DeepMind发现LLM存在"盲从效应"，这可能颠覆我们对AI的认知 |COLM 2024

在当今人工智能迅猛发展的时代，大语言模型（LLMs）已成为众多AI应用的核心引擎。然而，来自ETH Zurich和Google DeepMind的一项最新研究揭示了一个令人深思的现象：这些看似强大的模型存在着严重的“盲从效应”。

来自主题: AI技术研报

6095 点击 2024-11-25 09:44

研究大模型门槛太高？不妨看看小模型SLM，知识点都在这

我们对小型语言模型的增强方法、已存在的小模型、应用、与 LLMs 的协作、以及可信赖性方面进行了详细调查。

来自主题: AI技术研报

6664 点击 2024-11-24 20:02

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你「LLM+外部数据」的正确使用姿势

论文提出了一种RAG任务分类法，将用户查询分为四个级别，并讨论了将外部数据集成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务，每个级别都有其独特的难点和解决方案，需要不同的技术和方法来优化性能。

来自主题: AI技术研报

8359 点击 2024-11-21 13:39

NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强？北大、MIT团队给出理论解释

自我纠错（Self Correction）能力，传统上被视为人类特有的特征，正越来越多地在人工智能领域，尤其是大型语言模型（LLMs）中得到广泛应用，最近爆火的OpenAI o1模型[1]和Reflection 70B模型[2]都采取了自我纠正的方法。

来自主题: AI技术研报

5646 点击 2024-11-18 14:54

用LaTRO框架，通过自我奖励机制来激发LLM潜在推理能力，基准上提升12.5% |Salesforce重磅

大规模语言模型（LLMs）已经在自然语言处理任务中展现了卓越的能力，但它们在复杂推理任务上依旧面临挑战。推理任务通常需要模型具有跨越多个步骤的推理能力，这超出了LLMs在传统训练阶段的表现。

来自主题: AI资讯

7493 点击 2024-11-15 10:34

1000多个智能体组成，AI社会模拟器MATRIX-Gen助力大模型自我进化

随着大语言模型（LLMs）在处理复杂任务中的广泛应用，高质量数据的获取变得尤为关键。为了确保模型能够准确理解并执行用户指令，模型必须依赖大量真实且多样化的数据进行后训练。然而，获取此类数据往往伴随着高昂的成本和数据稀缺性。因此，如何有效生成能够反映现实需求的高质量合成数据，成为了当前亟需解决的核心挑战。

来自主题: AI技术研报

7388 点击 2024-11-14 14:07