AI资讯新闻榜单内容搜索-R1

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: R1

应激的Llama，开源的困局

应激的Llama，开源的困局

应激的Llama，开源的困局

在DeepSeek R1-V3、GPT-4o、Claude-3.7的强势围攻下，Meta坐不住了。曾作为开源之光的Llama在一年的竞争内连连失利，并没有研发出让公众惊艳的功能。创始人扎克伯格下达死命令，今年4月一定要更新。

来自主题: AI资讯

8756 点击 2025-04-25 08:56

高考考上985的AI来了！超强数理推理横扫真题，训练秘籍剑指AGI

高考考上985的AI来了！超强数理推理横扫真题，训练秘籍剑指AGI

高考考上985的AI来了！超强数理推理横扫真题，训练秘籍剑指AGI

昆仑万维Skywork-R1V 2.0版本，开源了！这一次，它的多模态推理实现了再进化，成为最强高考数理解题利器，直接就是985水平。而团队也大方公开了各项技术秘籍，亮点满满。可以说，R1V 2.0已成为团队AGI之路上的又一里程碑。

来自主题: AI技术研报

9501 点击 2025-04-24 17:54

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明，大规模强化学习已成为一种极为有效的方法，能够激发大型语言模型（LLM) 的复杂推理行为并显著提升其能力。

来自主题: AI技术研报

8778 点击 2025-04-23 14:04

2025中国AI出海洞察

2025中国AI出海洞察

2025中国AI出海洞察

2025开年伊始，从1月DeepSeek R1发布引发新一轮国产大模型技术爆发，到3月Manus横空出世启动内测打开AI智能体话题热度，从底层基础设施到终端产品应用，从产业深耕提升纵深能力到产品创新形成差异化竞争优势，无论是技术能力还是商业模式，国产AI都处于全球领先水平。海外无论是政策环境还是供需关系，均从内外部双轮驱动国产AI出海蓄势待发。

来自主题: AI资讯

7953 点击 2025-04-23 09:34

142页长文揭秘DeepSeek-R1「思维大脑」！开启全新「思维链学」研究

142页长文揭秘DeepSeek-R1「思维大脑」！开启全新「思维链学」研究

142页长文揭秘DeepSeek-R1「思维大脑」！开启全新「思维链学」研究

DeepSeek-R1是近年来推理模型领域的一颗新星，它不仅突破了传统LLM的局限，还开启了全新的研究方向「思维链学」（Thoughtology）。这份长达142页的报告深入剖析了DeepSeek-R1的推理过程，揭示了其推理链的独特结构与优势，为未来推理模型的优化提供了重要启示。

来自主题: AI技术研报

9895 点击 2025-04-22 18:59

Sebastian Raschka长文：DeepSeek-R1、o3背后，RL推理训练正悄悄突破上限

Sebastian Raschka长文：DeepSeek-R1、o3背后，RL推理训练正悄悄突破上限

Sebastian Raschka长文：DeepSeek-R1、o3背后，RL推理训练正悄悄突破上限

只靠模型尺寸变大已经不行了？大语言模型（LLM）推理需要强化学习（RL）来「加 buff」。

来自主题: AI技术研报

9387 点击 2025-04-22 16:58

UIUC联手谷歌发布Search-R1：大模型学会「边想边查」，推理、搜索无缝切换

UIUC联手谷歌发布Search-R1：大模型学会「边想边查」，推理、搜索无缝切换

UIUC联手谷歌发布Search-R1：大模型学会「边想边查」，推理、搜索无缝切换

DeepSeek-R1 展示了强化学习在提升模型推理能力方面的巨大潜力，尤其是在无需人工标注推理过程的设定下，模型可以学习到如何更合理地组织回答。然而，这类模型缺乏对外部数据源的实时访问能力，一旦训练语料中不存在某些关键信息，推理过程往往会因知识缺失而失败。

来自主题: AI技术研报

9080 点击 2025-04-22 09:02

扩散LLM推理用上类GRPO强化学习！优于单独SFT，UCLA、Meta新框架d1开源

扩散LLM推理用上类GRPO强化学习！优于单独SFT，UCLA、Meta新框架d1开源

扩散LLM推理用上类GRPO强化学习！优于单独SFT，UCLA、Meta新框架d1开源

当前，强化学习（RL）方法在最近模型的推理任务上取得了显著的改进，比如 DeepSeek-R1、Kimi K1.5，显示了将 RL 直接用于基础模型可以取得媲美 OpenAI o1 的性能不过，基于 RL 的后训练进展主要受限于自回归的大语言模型（LLM），它们通过从左到右的序列推理来运行。

来自主题: AI技术研报

7544 点击 2025-04-22 08:39

全国产算力！一手实测科大讯飞推理模型星火X1，与R1不相上下？

全国产算力！一手实测科大讯飞推理模型星火X1，与R1不相上下？

全国产算力！一手实测科大讯飞推理模型星火X1，与R1不相上下？

就在昨天，深耕语音、认知智能几十年的科大讯飞，发布了全新升级的讯飞星火推理模型 X1。不仅效果上比肩 DeepSeek-R1，而且我注意到一条官方发布的信息——基于全国产算力训练，在模型参数量比业界同类模型小一个数量级的情况下，整体效果能对标 OpenAI o1 和 DeepSeek R1。

来自主题: AI资讯

10758 点击 2025-04-22 08:29

DeepSeek-R1「内心世界」首次曝光！AI显微镜破解R1大脑，发现神秘推理机制

DeepSeek-R1「内心世界」首次曝光！AI显微镜破解R1大脑，发现神秘推理机制

DeepSeek-R1「内心世界」首次曝光！AI显微镜破解R1大脑，发现神秘推理机制

推理模型与普通大语言模型有何本质不同？它们为何会「胡言乱语」甚至「故意撒谎」？Goodfire最新发布的开源稀疏自编码器（SAEs），基于DeepSeek-R1模型，为我们提供了一把「AI显微镜」，窥探推理模型的内心世界。

来自主题: AI技术研报

7748 点击 2025-04-19 15:29

上一页当前第17页,共41页下一页