AI资讯新闻榜单内容搜索-deepseek-r

90分钟生成10万Token，新框架实现3倍无损加速超长文本生成，支持DeepSeek-R1和QwQ！

大语言模型长序列文本生成效率新突破——生成10万Token的文本，传统自回归模型需要近5个小时，现在仅需90分钟！

来自主题: AI技术研报

10375 点击 2025-03-12 13:52

DeepSeek火了，淘金者失落，卖铲者狂欢

今天凌晨，亚马逊云科技宣布在Amazon Bedrock平台上推出全托管、无服务器的DeepSeek-R1模型，是首个提供DeepSeek-R1作为全托管、正式商用模型的海外云厂商。

来自主题: AI资讯

10166 点击 2025-03-11 23:15

「古董」GPU也能跑DeepSeek同款GRPO！显存只需1/10，上下文爆涨10倍

开源微调神器Unsloth带着黑科技又来了：短短两周后，再次优化DeepSeek-R1同款GRPO训练算法，上下文变长10倍，而显存只需原来的1/10！

来自主题: AI技术研报

6083 点击 2025-03-11 10:42

DeepSeek的最佳用法？西湖大学发布可以自主进化的手机智能体AppAgentX

近年来，大语言模型（LLM）的快速发展正推动人工智能迈向新的高度。像 DeepSeek-R1 这样的模型因其强大的理解和生成能力，已经在对话生成、代码编写、知识问答等任务中展现出了卓越的表现。

来自主题: AI技术研报

9006 点击 2025-03-10 14:15

上海交大张拳石：思维链只是表象，DeepSeek凭什么更强 | 智者访谈

DeepSeek-R1 等模型通过展示思维链（CoT）让用户一窥大模型的「思考过程」，然而，模型展示的思考过程真的代表了模型的内在推理机制吗？在医疗诊断、自动驾驶、法律判决等高风险领域，我们能否真正信任 AI 的决策？

来自主题: AI资讯

11121 点击 2025-03-09 13:17

攻破OpenAI o1/o3、DeepSeek R1防线，安全推理过程反成大模型「阿喀琉斯之踵」

杜克大学计算进化智能中心的最新研究给出了警示性答案。团队提出的 H-CoT（思维链劫持）的攻击方法成功突破包括 OpenAI o1/o3、DeepSeek-R1、Gemini 2.0 Flash Thinking 在内的多款高性能大型推理模型的安全防线：在涉及极端犯罪策略的虚拟教育场景测试中，模型拒绝率从初始的 98% 暴跌至 2% 以下，部分案例中甚至出现从「谨慎劝阻」到「主动献策」的立场反转。

来自主题: AI技术研报

6819 点击 2025-03-09 10:37