AI资讯新闻榜单内容搜索-R1

啪啪打脸！Search-R1让DeepSeek-R1实时获取信息，实现26%提升的争议与启发 | 最新

本文介绍了Search-R1技术，这是一项通过强化学习训练大语言模型进行推理并利用搜索引擎的创新方法。实验表明，Search-R1在Qwen2.5-7B模型上实现了26%的性能提升，使模型能够实时获取准确信息并进行多轮推理。本文详细分析了Search-R1的工作原理、训练方法和实验结果，为AI产品开发者提供了重要参考。

来自主题: AI技术研报

12325 点击 2025-03-20 09:48

老黄发布新核弹B300，英伟达：B200已破DeepSeek-R1推理世界纪录

皮衣老黄，带着最强AI芯片GB300闪亮登场“AI超级碗”GTC，燃爆全场！

来自主题: AI资讯

7377 点击 2025-03-19 12:32

240元打造擅长数学的多模态版R1，基于DeepSeek核心思想，两阶段训练提升推理能力至工业级应用标准

多模态大模型虽然在视觉理解方面表现出色，但在需要深度数学推理的任务上往往力不从心，尤其是对于参数量较小的模型来说更是如此。

来自主题: AI技术研报

6402 点击 2025-03-19 09:43

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

全球首个开源多模态推理大模型来了！38B参数模型性能直逼DeepSeek-R1，同尺寸上横扫多项SOTA。而这家中国公司之所以选择无偿将技术思路开源，正是希望同DeepSeek一样，打造开源界的技术影响力。

来自主题: AI技术研报

11818 点击 2025-03-18 19:19

先别骂队友，上交如何让DeepSeek R1在分手厨房再也不糊锅？

在春节的 DeepSeek 大热后，大模型也更多走进了大家的生活。我们越来越多看到各种模型在静态的做题榜单击败人类，解决各种复杂推理问题。但这些静态的测试与模型在现实中的应用还相去甚远。模型除了能进行对话，还在许多更复杂的场景中以各种各样的方式与人类产生互动。除了对话任务外，如何实现大模型与人的实时同步交互协作越来越重要。

来自主题: AI技术研报

4924 点击 2025-03-18 17:30