AI资讯新闻榜单内容搜索-deepseek

长链推理表象下，大模型精细表征张冠李戴的本质

近些年，大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始，到 2022 年底的 GPT-3，再到现在国内外大模型的「百模争锋」，DeepSeek 异军突起，各类大模型应用层出不穷。

来自主题: AI技术研报

11566 点击 2025-03-13 14:41

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

大语言模型（LLM）在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力，比如 OpenAI 的 o1 系列。

来自主题: AI技术研报

8877 点击 2025-03-13 14:41

DeepSeek玩家能提前拿苹果新品！只要15万元，在家跑满血版R1

号称地表最强的M3 Ultra，本地跑满血版DeepSeek R1，效果到底如何？

来自主题: AI资讯

7410 点击 2025-03-13 14:29

浙大帮、清华帮，谁会是AI时代的新C9

开年以来，DeepSeek的梁文锋、Manus的肖弘，成为中国AI圈冉冉升起的新星。培养他们的母校浙江大学和华中科技大学也一并沾光。

来自主题: AI资讯

11051 点击 2025-03-13 10:19

刚刚，谷歌Gemma 3上线！单GPU最强多模态手机可跑，27B完胜o3-mini

就在刚刚，谷歌Gemma 3来了，1B、4B、12B和27B四种参数，一块GPU/TPU就能跑！而Gemma 3仅以27B就击败了DeepSeek 671B模型，成为仅次于DeepSeek R1最优开源模型。

来自主题: AI资讯

10172 点击 2025-03-12 18:43

32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

Hugging Face的Open R1重磅升级，7B击败Claude 3.7 Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10万高质量样本、IOI难题的严苛测试，以及模拟真实竞赛的提交策略优化，这款模型展现了惊艳的性能。

来自主题: AI资讯

10054 点击 2025-03-12 18:35

90分钟生成10万Token，新框架实现3倍无损加速超长文本生成，支持DeepSeek-R1和QwQ！

大语言模型长序列文本生成效率新突破——生成10万Token的文本，传统自回归模型需要近5个小时，现在仅需90分钟！

来自主题: AI技术研报

10331 点击 2025-03-12 13:52

AI融资的明路、暗路、崎岖路

在DeepSeek与Manus火热前，国内AI几乎经历了凛冽的2024。

来自主题: AI资讯

8459 点击 2025-03-12 09:32

DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规

乙巳新春，中国的推理大模型DeepSeek R1火爆全球。作为一款在推理能力上媲美OpenAI的o1且收费标准远低于o1的国产大模型，DeepSeek一时间在国内刮起一股扑面而来的全民AI风潮，并不令人意外，但这款来自大厂体系外创业团队的开源大模型，经由数位外国商界领袖与技术大佬口碑相传并最终形成在外国新闻媒体上“刷屏”的效果，则是非常耐人寻味了。

来自主题: AI监管政策

12903 点击 2025-03-11 23:53

阿里国际站AI布局引多家外媒关注：AI搜索Accio企业用户超百万

日前，阿里国际站总裁张阔在接受《南华早报》等多家外媒专访时透露，面向海外买家推出的AI搜索引擎Accio企业用户已超百万。2月，阿里国际站的全线AI产品相继接入Qwen2.5、DeepSeek等先进推理模型，尤其是原生AI应用Accio的推出，让阿里国际站的AI应用引发全球高度关注。

来自主题: AI资讯

10552 点击 2025-03-11 23:46