
DeepSeek 后,第一批的生态锚位
DeepSeek 后,第一批的生态锚位事情要从一张图说起
事情要从一张图说起
自春节以来,DeepSeek 就一直是 AI 领域最热门的关键词,甚至可能没有之一,其官方 App 成为了史上最快突破 3000 万日活的应用。最近一段时间,各家 AI 或云服务厂商更是掀起了部署 DeepSeek-R1 服务的狂潮,甚至让薅羊毛的用户们都有点忙不过来了。
DeepSeek 又又又来搞抽象了! 继上次做人类从未见过的菜之后,网友又想到了个新路数: 教化妆。
早在2024年5月,DeepSeek-V2就凭借GPT-4的百分之一的价格,被称作“价格屠夫”、“AI界的拼多多”,彼时,它带来的冲击还停留在底层模型竞争中的定价等具体动作。
最新大语言模型推理测试引众议,DeepSeek R1常常在提供错误答案前就“我放弃”了?? Cursor刚刚参与了一项研究,他们基于NPR周日谜题挑战(The Sunday Puzzle),构建了一个包含近600个问题新基准测试。
让DeepSeek代替Claude思考,缝合怪玩法火了。原因无它:比单独使用DeepSeek R1、Claude Sonnet 3.5、OpenAI o1模型的效果更好。DeepClaude应用本身100%免费且开源,在GitHub上已揽获3k星星(当然API要用自己的)。
DeepSeek掀起的算力热潮还在持续。中国电信昨日宣布推出了息壤智算一体机-DeepSeek版,在硬件层面以华为昇腾芯片为基础,提供8卡、16卡、32卡等多种规格型号。此前,京东云也发布DeepSeek大模型一体机,支持华为昇腾、海光、寒武纪、摩尔线程、天数智芯等国产AI加速芯片。《科创板日报》了解到,华鲲振宇也推出了DeepSeek大模型一体机方案。
判断哪些是凑热闹的供应商
“春节回来,咨询融科的客户多了很多很多。”DeepSeek爆红后,其研发团队所在的北京融科资讯中心也意外火了起来。投资界获悉,DeepSeek北京办公室还将迎来一位新邻居——此前华为租下数千平方米面积,正在装修。
近日,斯坦福、UC伯克利等多机构联手发布了开源推理新SOTA——OpenThinker-32B,性能直逼DeepSeek-R1-32B。其成功秘诀在于数据规模化、严格验证和模型扩展。