AI资讯新闻榜单内容搜索-推理模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 推理模型

重磅开源！首个全异步强化学习训练系统来了，SOTA推理大模型RL训练提速2.77倍

重磅开源！首个全异步强化学习训练系统来了，SOTA推理大模型RL训练提速2.77倍

重磅开源！首个全异步强化学习训练系统来了，SOTA推理大模型RL训练提速2.77倍

想训练属于自己的高性能推理模型，却被同步强化学习（RL）框架的低效率和高门槛劝退？AReaL 全面升级，更快，更强，更好用！

来自主题: AI技术研报

7446 点击 2025-06-04 14:05

MiniMax正暗戳戳憋大招

MiniMax正暗戳戳憋大招

MiniMax正暗戳戳憋大招

MiniMax即将发布代号M+的文本推理模型，其表现将影响公司未来竞争力。面对DeepSeek R1的冲击，MiniMax采取国内C端不接入、海外接入的策略，并推出类Manus产品MiniMax Agent。公司通过品牌拆分（海螺AI更名）、纯API商业模式拓展市场，语音模型商业化效果显著，但未进入“基模五强”名单。新推理模型或成其保持行业地位的关键。

来自主题: AI资讯

9211 点击 2025-06-03 00:16

首次解释LLM如何推理反思！西北大学谷歌新框架：引入贝叶斯自适应强化学习，数学推理全面提升

首次解释LLM如何推理反思！西北大学谷歌新框架：引入贝叶斯自适应强化学习，数学推理全面提升

首次解释LLM如何推理反思！西北大学谷歌新框架：引入贝叶斯自适应强化学习，数学推理全面提升

推理模型常常表现出类似自我反思的行为，但问题是——这些行为是否真的能有效探索新策略呢？

来自主题: AI技术研报

7848 点击 2025-06-02 17:48

o3崛起，但推理模型离「撞墙」只剩一年？

o3崛起，但推理模型离「撞墙」只剩一年？

o3崛起，但推理模型离「撞墙」只剩一年？

OpenAI的o3推理模型席卷AI界，算力暴增10倍，能力突飞猛进！但专家警告：最多一年，推理模型可能一年内撞上算力资源极限。OpenAI还能否带来惊喜？

来自主题: AI技术研报

9744 点击 2025-05-31 15:36

让视觉语言模型像o3一样动手搜索、写代码！Visual ARFT实现多模态智能体能力

让视觉语言模型像o3一样动手搜索、写代码！Visual ARFT实现多模态智能体能力

让视觉语言模型像o3一样动手搜索、写代码！Visual ARFT实现多模态智能体能力

在大型推理模型（例如 OpenAI-o3）中，一个关键的发展趋势是让模型具备原生的智能体能力。具体来说，就是让模型能够调用外部工具（如网页浏览器）进行搜索，或编写/执行代码以操控图像，从而实现「图像中的思考」。

来自主题: AI技术研报

10432 点击 2025-05-27 16:53

只用图像也能思考，强化学习造就推理模型新范式！复杂场景规划能力Max

只用图像也能思考，强化学习造就推理模型新范式！复杂场景规划能力Max

只用图像也能思考，强化学习造就推理模型新范式！复杂场景规划能力Max

近年来，LLM 及其多模态扩展（MLLM）在多种任务上的推理能力不断提升。然而，现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介，即便是在处理视觉信息时也是如此。

来自主题: AI技术研报

8377 点击 2025-05-26 09:59

DeepSeek用的GRPO有那么特别吗？万字长文分析四篇精品论文

DeepSeek用的GRPO有那么特别吗？万字长文分析四篇精品论文

DeepSeek用的GRPO有那么特别吗？万字长文分析四篇精品论文

本文详细解读了 Kimi k1.5、OpenReasonerZero、DAPO 和 Dr. GRPO 四篇论文中的创新点，读完会对 GRPO 及其改进算法有更深的理解，进而启发构建推理模型的新思路。

来自主题: AI技术研报

11056 点击 2025-05-24 14:33

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

DeepSeek-R1火了，推理模型火了，思维链（Chain-of-Thought，CoT）火了！

来自主题: AI技术研报

8656 点击 2025-05-21 15:28

OpenAI自曝：AI推理砸钱越多，碾压人类越狠！

OpenAI自曝：AI推理砸钱越多，碾压人类越狠！

OpenAI自曝：AI推理砸钱越多，碾压人类越狠！

你以为GPT-4已经够强了？那只是AI的「预热阶段」。真正的革命，才刚刚开始——推理模型的时代，来了。这场范式革命，正深刻影响企业命运和个人前途。这不是一场模型参数的升级，而是一次认知逻辑的彻底重写。

来自主题: AI资讯

7867 点击 2025-05-18 15:17

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

大型推理模型（如 OpenAI-o1、DeepSeek-R1）展现了强大的推理能力，但其静态知识限制了在复杂知识密集型任务及全面报告生成中的表现。为应对此挑战，深度研究智能体 WebThinker 赋予 LRM 在推理中自主搜索网络、导航网页及撰写报告的能力。

来自主题: AI技术研报

7671 点击 2025-05-16 11:04

上一页当前第7页,共20页下一页