AI资讯新闻榜单内容搜索-arXiv

北航等机构发布最新综述：大语言模型集成 | ArXiv 2025

LLM Ensemble（大语言模型集成）在近年来快速地获得了广泛关注。它指的是在下游任务推理阶段，综合考虑并利用多个大语言模型（每个模型都旨在处理用户查询），从而发挥它们各自的优势。大语言模型的广泛可得性，以及其开箱即用的特性和各个模型所具备的不同优势，极大地推动了 LLM Ensemble 领域的发展。

来自主题: AI技术研报

9125 点击 2025-06-17 17:03

仅凭一篇博客，他成功入职OpenAI！核心技术或用于GPT-5训练

未中顶会，没有发表arXiv，一篇博客却成为OpenAI速通票。天才科学家Keller Jordan仅凭Muon优化器博客加入OpenAI。甚至，它可能被用于训练下一代超级模型GPT-5。

来自主题: AI资讯

8781 点击 2025-06-16 17:22

Qwen&清华团队颠覆常识：大模型强化学习仅用20%关键token，比用全部token训练还好

近期arxiv最热门论文，Qwen&清华LeapLab团队最新成果：在强化学习训练大模型推理能力时，仅仅20%的高熵token就能撑起整个训练效果，甚至比用全部token训练还要好。

来自主题: AI技术研报

7232 点击 2025-06-06 11:08

LSTM之父22年前构想将成真？一周内AI「自我进化」论文集中发布，新趋势涌现？

在过去的一周，这一方向的进展尤其丰富。有人发现，几篇关于「让 LLM（或智能体）学会自我训练」的论文在 arXiv 上集中出现，其中甚至包括受「哥德尔机」构想启发而提出的「达尔文哥德尔机」。或许，AI 模型的自我进化能力正在加速提升。

来自主题: AI技术研报

8340 点击 2025-06-03 09:36

论文党狂喜！alphaXiv推出Deep Research一秒搜遍arXiv，研究效率直接爆表

刚刚，alphaXiv 推出了新功能「Deep Research for arXiv」，该功能可协助研究人员更高效地在 arXiv 平台上进行学术论文的检索与阅读，显著提升文献检索及研究效率。

来自主题: AI技术研报

10341 点击 2025-04-09 16:07

本地也能运行Deep Research！支持arXiv平台，兼容PDF、Markdown等

今年年初，OpenAI 上线 Deep Research，开启了智能体又一新阶段，其能根据用户需求自主进行网络信息检索、整合多源信息、深度分析数据，并最终为用户提供全面深入的解答。

来自主题: AI资讯

8534 点击 2025-03-18 19:06

arXiv科研神器：Mistral OCR、Claude 3.7合体实现论文速读

现在是 2025 年，新论文要以博客形式出现。

来自主题: AI技术研报

7679 点击 2025-03-14 16:47

Multi-Agent辩论树ToD：让AI具备批判性思维，用R1推理，解决复杂认知任务

随着AI工具越来越普及，类似Deep Researh这样的工具越来越好用，科学研究成果呈现爆炸式增长。以arXiv为例，仅2024年10月就收到超过24,000篇论文提交。

来自主题: AI技术研报

9859 点击 2025-02-24 10:09

2024-arXiv-FinRobot: 一种基于大语言模型的开源金融应用 AI 智能体平台

随着金融机构和专业人士越来越多地将大语言模型（LLMs）纳入其工作流程中，金融领域与人工智能社区之间依然存在显著障碍，包括专有数据和专业知识的壁垒。本文提出了 FinRobot，一种支持多个金融专业化人工智能智能体的新型开源 AI 智能体平台，每个代理均由 LLM 提供动力。

来自主题: AI技术研报

8817 点击 2025-02-20 11:33

见证历史！AI想的科研idea，真被人类写成论文发表了

天啦撸！！AI想出来的idea，还真有人写成论文了。甚至预印本arXiv、博客、代码全都有了。今年8月，Sakana AI（由Transformer论文8位作者的最后一位Llion Jones创业成立）这家公司推出了史上首位“AI科学家”，且一登场就一口气生成了十篇完整学术论文。

来自主题: AI资讯

9355 点击 2024-12-18 12:49