AI资讯新闻榜单内容搜索-QwQ

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: QwQ

DeepSeek-R1推理智能从哪儿来？谷歌新研究：模型内心多个角色吵翻了

DeepSeek-R1推理智能从哪儿来？谷歌新研究：模型内心多个角色吵翻了

DeepSeek-R1推理智能从哪儿来？谷歌新研究：模型内心多个角色吵翻了

过去两年，大模型的推理能力出现了一次明显的跃迁。在数学、逻辑、多步规划等复杂任务上，推理模型如 OpenAI 的 o 系列、DeepSeek-R1、QwQ-32B，开始稳定拉开与传统指令微调模型的差距。直观来看，它们似乎只是思考得更久了：更长的 Chain-of-Thought、更高的 test-time compute，成为最常被引用的解释。

来自主题: AI技术研报

7110 点击 2026-01-26 15:02

四万字·深度求索｜泛聊一下强化学习(RL)下的深度推理(DR)对真实世界(RW)建模与泛化的本质

四万字·深度求索｜泛聊一下强化学习(RL)下的深度推理(DR)对真实世界(RW)建模与泛化的本质

四万字·深度求索｜泛聊一下强化学习(RL)下的深度推理(DR)对真实世界(RW)建模与泛化的本质

强化学习·RL范式尝试为LLMs应用于广泛的Agentic AI甚至构建AGI打开了一扇“深度推理”的大门，而RL是否是唯一且work的一扇门，先按下不表（不作为今天跟大家唠的重点），至少目前看来，随着o1/o3/r1/qwq..等一众语言推理模型的快速发展，正推动着LLMs和Agentic AI在不同领域的价值与作用，

来自主题: AI技术研报

11869 点击 2025-06-13 10:48

200美金，人人可手搓QwQ，清华、蚂蚁开源极速RL框架AReaL-boba

200美金，人人可手搓QwQ，清华、蚂蚁开源极速RL框架AReaL-boba

200美金，人人可手搓QwQ，清华、蚂蚁开源极速RL框架AReaL-boba

由于 DeepSeek R1 和 OpenAI o1 等推理模型（LRM，Large Reasoning Model）带来了新的 post-training scaling law，强化学习（RL，Reinforcement Learning）成为了大语言模型能力提升的新引擎。然而，针对大语言模型的大规模强化学习训练门槛一直很高：

来自主题: AI技术研报

11824 点击 2025-03-31 15:07

实测新版通义 APP：更好用的个人 AI 助理，需要什么？

实测新版通义 APP：更好用的个人 AI 助理，需要什么？

实测新版通义 APP：更好用的个人 AI 助理，需要什么？

正式并入阿里 AI To C 业务之后，通义有了新的动作。

来自主题: AI资讯

7578 点击 2025-03-13 15:54

90分钟生成10万Token，新框架实现3倍无损加速超长文本生成，支持DeepSeek-R1和QwQ！

90分钟生成10万Token，新框架实现3倍无损加速超长文本生成，支持DeepSeek-R1和QwQ！

90分钟生成10万Token，新框架实现3倍无损加速超长文本生成，支持DeepSeek-R1和QwQ！

大语言模型长序列文本生成效率新突破——生成10万Token的文本，传统自回归模型需要近5个小时，现在仅需90分钟！

来自主题: AI技术研报

10394 点击 2025-03-12 13:52

Free QWQ - 世界首个免费无限制分布式 QwQ API

Free QWQ - 世界首个免费无限制分布式 QwQ API

Free QWQ - 世界首个免费无限制分布式 QwQ API

大家好，很高兴在这里向各位介绍我们的产品 Free QWQ。这是世界上第一个完全免费、无限制、无需注册登录的分布式 AI 算力平台，基于 QwQ 32B 大语言模型提供强大的 AI 服务。

来自主题: AI资讯

10501 点击 2025-03-09 12:02

7B的DeepSeek蒸馏Qwen数学超o1！在测试时间强化学习，MIT积分题大赛考93分

7B的DeepSeek蒸馏Qwen数学超o1！在测试时间强化学习，MIT积分题大赛考93分

7B的DeepSeek蒸馏Qwen数学超o1！在测试时间强化学习，MIT积分题大赛考93分

见识过32B的QwQ追平671的DeepSeek R1后——刚刚，7B的DeepSeek蒸馏Qwen模型超越o1又是怎么一回事？新方法LADDER，通过递归问题分解实现AI模型的自我改进，同时不需要人工标注数据。

来自主题: AI技术研报

6542 点击 2025-03-08 10:38

全球首发：QwQ-32B本地一键部署、3090单卡可跑，共享算力成关键

全球首发：QwQ-32B本地一键部署、3090单卡可跑，共享算力成关键

全球首发：QwQ-32B本地一键部署、3090单卡可跑，共享算力成关键

仅仅过了一天，阿里开源的新一代推理模型便能在个人设备上跑起来了！昨天深夜，阿里重磅开源了参数量 320 亿的全新推理模型 QwQ-32B，其性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。

来自主题: AI资讯

10342 点击 2025-03-07 17:12

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

仅用32B，就击败o1-mini追平671B满血版DeepSeek-R1！阿里深夜重磅发布的QwQ-32B，再次让全球开发者陷入狂欢：消费级显卡就能跑，还一下子干到推理模型天花板！

来自主题: AI技术研报

7569 点击 2025-03-07 10:28

阿里深夜开源推理模型QwQ-32B，性能比肩R1满血版。

阿里深夜开源推理模型QwQ-32B，性能比肩R1满血版。

阿里深夜开源推理模型QwQ-32B，性能比肩R1满血版。

今夜，Manus发布之后，随之而来赶到战场的，是阿里。

来自主题: AI资讯

5968 点击 2025-03-06 11:55

上一页当前第1页,共2页下一页