AI资讯新闻榜单内容搜索-LLM

太疯狂了，仅100行56KB的LLM框架，用Cursor复刻一个一模一样的cursor | 已开源

现在各种框架满天飞，你是否想过这个问题，一个真正优秀的框架究竟需要多少代码？研究者Zach给出了一个令人惊讶的答案：仅需100行。这个名为PocketFlow的框架不仅体积小到令人难以置信（仅56KB），还能用来构建一个完整的Cursor编码助手。这个发现不仅挑战了我们对框架复杂性的认知，更揭示了一个重要的设计哲学：真正的创新往往来自于化繁为简。

来自主题: AI技术研报

8838 点击 2025-03-18 18:55

超越DeepSeek GRPO的关键RL算法，字节、清华AIR开源DAPO

DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率，不过其论文中似乎还缺少一些关键细节，让人难以复现出大规模和工业级的强化学习系统。

来自主题: AI技术研报

6215 点击 2025-03-18 17:14

RAG进阶：混合稠密检索和知识图谱来提升精度

HuixiangDou 是群聊场景的 LLM 知识助手。

来自主题: AI技术研报

9223 点击 2025-03-17 16:44

大模型怎么做好角色扮演？最大的真实数据集、SoTA开源模型、最深入的评估在这里

角色扮演 AI（Role-Playing Language Agents，RPLAs）作为大语言模型（LLM）的重要应用，近年来获得了广泛关注。

来自主题: AI技术研报

10076 点击 2025-03-17 16:30

AI 大模型创业，悄悄盯上年轻人最爱的「谷子经济」

Neurobo（弈智交互）是一家位于上海的创业公司，获得前百度总裁、微软副总裁陆奇博士创办的奇绩创坛的投资。团队核心成员来自清华大学与日本筑波大学等海内外名校，致力于结合 LLM 与现实场景数据，让二次元用户可以将「谷子」变为随身相伴，随时触达的实体情感伴侣。

来自主题: AI资讯

8261 点击 2025-03-16 20:05

谷歌重磅推出全新Scaling Law，抢救Transformer！3万亿美元AI面临岔路

谷歌团队发现了全新Scaling Law！新方法DiLoCo被证明更好、更快、更强，可在多个数据中心训练越来越大的LLM。

来自主题: AI技术研报

6225 点击 2025-03-16 16:09

无需训练，100%完美检索！LLM练出「火眼金睛」，InfiniRetri超长文本一针见血

LLM自身有望在无限长token下检索信息！无需训练，在检索任务「大海捞针」（Needle-in-a-Haystack）测试中，新方法InfiniRetri让有效上下文token长度从32K扩展至1000+K，让7B模型比肩72B模型。

来自主题: AI技术研报

9472 点击 2025-03-16 13:28

AI大佬曼宁转赞，MetaGPT团队首提「Atom of Thoughts」，原子化思考让4o-mini暴打推理模型？

大语言模型（LLM）近年来凭借训练时扩展（train-time scaling）取得了显著性能提升。然而，随着模型规模和数据量的瓶颈显现，测试时扩展（test-time scaling）成为进一步释放潜力的新方向。

来自主题: AI技术研报

8137 点击 2025-03-16 12:42

医学可用！推理增强RAG：精准诊断、智能补问、高效解析 | WWW 2025

南洋理工大学的研究团队提出了MedRAG模型，通过结合知识图谱推理增强大语言模型（LLM）的诊断能力，显著提升智能健康助手的诊断精度和个性化建议水平。MedRAG在真实临床数据集上表现优于现有模型，准确率提升11.32%，并具备良好的泛化能力，可广泛应用于不同LLM基模型。

来自主题: AI技术研报

6041 点击 2025-03-14 16:19

3700次预训练总结超参规律，开源海量实验，告别盲猜

近年来，大语言模型 LLMs 在多种任务上的卓越表现已得到广泛认可。然而，要实现其高效部署，精细的超参数优化至关重要。为了探究最佳超参数的规律，我们开展了大规模的实证研究，通过在不同配置上进行网格搜索，我们揭示了一套通用的最优超参数缩放定律（Optimal Hyperparameter Scaling Law）。

来自主题: AI技术研报

9510 点击 2025-03-13 15:15