AI资讯新闻榜单内容搜索-推理模型

Github超2万星，OpenManus核心作者聊Agent发展趋势

随着推理模型能力提升，本周Agent也进入刷屏周。

来自主题: AI资讯

9298 点击 2025-03-11 11:03

攻破OpenAI o1/o3、DeepSeek R1防线，安全推理过程反成大模型「阿喀琉斯之踵」

杜克大学计算进化智能中心的最新研究给出了警示性答案。团队提出的 H-CoT（思维链劫持）的攻击方法成功突破包括 OpenAI o1/o3、DeepSeek-R1、Gemini 2.0 Flash Thinking 在内的多款高性能大型推理模型的安全防线：在涉及极端犯罪策略的虚拟教育场景测试中，模型拒绝率从初始的 98% 暴跌至 2% 以下，部分案例中甚至出现从「谨慎劝阻」到「主动献策」的立场反转。

来自主题: AI技术研报

6792 点击 2025-03-09 10:37

全球首发：QwQ-32B本地一键部署、3090单卡可跑，共享算力成关键

仅仅过了一天，阿里开源的新一代推理模型便能在个人设备上跑起来了！昨天深夜，阿里重磅开源了参数量 320 亿的全新推理模型 QwQ-32B，其性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。

来自主题: AI资讯

10239 点击 2025-03-07 17:12

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

仅用32B，就击败o1-mini追平671B满血版DeepSeek-R1！阿里深夜重磅发布的QwQ-32B，再次让全球开发者陷入狂欢：消费级显卡就能跑，还一下子干到推理模型天花板！

来自主题: AI技术研报

7511 点击 2025-03-07 10:28

AI话痨终结者！UCSD清华提出「思维扫描术」Dynasor-CoT，推理巨省token

推理模型在复杂任务上表现惊艳，缺点是低下的token效率。UCSD清华等机构的研究人员发现，问题根源在于模型的「自我怀疑」！研究团队提出了Dynasor-CoT，一种无需训练、侵入性小且简单的方法。

来自主题: AI技术研报

10137 点击 2025-03-06 17:15

阿里深夜开源推理模型QwQ-32B，性能比肩R1满血版。

今夜，Manus发布之后，随之而来赶到战场的，是阿里。

来自主题: AI资讯

5929 点击 2025-03-06 11:55

第一个吃到DeepSeek红利的AI图像产品出现了？

在 R1 推理模型大火之后，全民接力集成 DeepSeek，有硅基流动这样的大模型云服务平台、有腾讯元宝这样的 Chatbot，甚至微信这样的顶流。但是，AI 图片类产品却鲜少有接入 DeepSeek R1 的新闻，而从 DeepSeek-R1 发布到 Krea 宣布上线新功能仅仅 10 天，这个反应应该是图像产品中最快的。

来自主题: AI资讯

5096 点击 2025-03-05 10:16