AI资讯新闻榜单内容搜索-LLM

无需训练，100%完美检索！LLM练出「火眼金睛」，InfiniRetri超长文本一针见血

LLM自身有望在无限长token下检索信息！无需训练，在检索任务「大海捞针」（Needle-in-a-Haystack）测试中，新方法InfiniRetri让有效上下文token长度从32K扩展至1000+K，让7B模型比肩72B模型。

来自主题: AI技术研报

10355 点击 2025-03-16 13:28

AI大佬曼宁转赞，MetaGPT团队首提「Atom of Thoughts」，原子化思考让4o-mini暴打推理模型？

大语言模型（LLM）近年来凭借训练时扩展（train-time scaling）取得了显著性能提升。然而，随着模型规模和数据量的瓶颈显现，测试时扩展（test-time scaling）成为进一步释放潜力的新方向。

来自主题: AI技术研报

9293 点击 2025-03-16 12:42

医学可用！推理增强RAG：精准诊断、智能补问、高效解析 | WWW 2025

南洋理工大学的研究团队提出了MedRAG模型，通过结合知识图谱推理增强大语言模型（LLM）的诊断能力，显著提升智能健康助手的诊断精度和个性化建议水平。MedRAG在真实临床数据集上表现优于现有模型，准确率提升11.32%，并具备良好的泛化能力，可广泛应用于不同LLM基模型。

来自主题: AI技术研报

7041 点击 2025-03-14 16:19

3700次预训练总结超参规律，开源海量实验，告别盲猜

近年来，大语言模型 LLMs 在多种任务上的卓越表现已得到广泛认可。然而，要实现其高效部署，精细的超参数优化至关重要。为了探究最佳超参数的规律，我们开展了大规模的实证研究，通过在不同配置上进行网格搜索，我们揭示了一套通用的最优超参数缩放定律（Optimal Hyperparameter Scaling Law）。

来自主题: AI技术研报

10440 点击 2025-03-13 15:15