Hi,我是洛小山,想和你深入唠唠 AI 产品。
前几天,Kimi 彻底开源了它的旗舰模型Kimi K2。
不仅代码、权重全免费,还放出MIT许可,任企业随便商用。
现在国内大模型赛道卷得这么厉害,Kimi 又没有自带生态,为什么突然做这种事?
带着这些问题,我找了比较详细的资料,想和你一起聊聊:
Kimi 为什么要彻底开源 Kimi K2,
它能靠开源成为中国版的 Anthropic 吗?
面临的挑战又是什么?
毕竟这一步棋,以及他们想要的,可能远比我们想象的更大。
为了验证一下 Kimi K2 的真实表现,我特意做了两个测试:
测试一:让 K2 调用 MCP 在线深度研究韩娱八卦(详细提示词见附录)
我使用 ChatWise + Puppeteer(操作浏览器的工具) ,让 K2 帮我挖一挖韩国 IU 最近的动态,吃吃瓜。
这个 Case ,顺利跑下来的,只有 Claude 3.7 / Claude 4 和 Qwen3 (虽然有 时Qwen 3 会进入死循环)。
结果确实超出预期,K2 的成功率,甚至比 Qwen3 还要高一些。
而且内容质量也不错,虽然还是会存在调用 MCP 参数问题带来的失败,但总体能完整跑下来。
横向对比 Kimi K2 和 Claude 4 Sonnet,怎么说呢?
K2 顺利调用了 MCP,实现了跨站搜索、数据抓取、内容整合,而且输出的瓜报像模像样,虽然缺少了一些指令遵循弱了一些,对于内容生成会有些欠缺,但能顺利跑下来,我觉得…勉强算及格吧。
截图结果:
左边是 Kimi K2(OpenRouter 版)
右边是 Claude 4 Sonnet (OpenRouter 版)
测试二:用 K2 与 Claude Code 对比 Cursor + Claude 4 Sonnet 做围棋游戏(提示词详见附录)
接下来直接综合性测试编程能力:这是一个AI围棋对战游戏项目,使用FastAPI后端转发AI消息,前端采用Tailwind CSS + JavaScript实现。
核心功能包括:支持用户与传统算法AI或大模型AI(OpenRouter、Qwen、Kimi)对局,提供多种游戏模式(人人、AI对战、观战),实现完整的中国围棋规则(气的计算、提子、死活判定、占领面积计算、数子计分),要有棋盘视觉提示、悔棋系统、对局回放等功能。
所有数据通过localStorage本地存储,支持API密钥管理、游戏设置配置,并提供响应式界面设计,确保在手机和桌面端都有良好的用户体验。
这是我构造的综合测试要求:既有功能,也有前后端服务,还有 JS 实现良好的数据结构和常见算法,最后包括给出代码片段实现具体逻辑。
最后,怎么说呢?
K2 虽然做的界面有点朴素,但至少能正常落子、AI 能正常落子,能和我交互,基本功能完整实现。
Cursor + Claude 4 Sonnet 理论上是顶级组合,对于命令的遵循性,对于界面设计,确实还是碾压的存在。
虽然右边的按钮几乎不能点,但从可用功能的角度来看,复杂需求的实现上,K2 大概相当于 40% 的 Clause 4 Sonnet,60-70% 的 3.5 吧…
小 Case 还行,但涉及交互界面、前后端交互、甚至涉及到 JS 写算法的复杂项目很难。
图片介绍:
左边是 Kimi K2 + Claude Code
右边是 Claude 4 Sonnet + Cursor
(没用 Claude + Claude Code 是因为没 API)
添加图片注释,不超过 140 字(可选)
虽然没能完全跑起来,但通过这次测试,我对 K2 有点改观:
在真实场景下,能跑起来永远是第一位的。
能顺利跑到底,能编过,至少证明它的编程能力已经超过市面上绝大多数的国产大模型,甚至比 Cursor + Cursor 这种海外顶级组合更接地气一些。
那么这样质量编程模型,为啥要开源?
下面,我和你慢慢拆解他开源的逻辑。
今天的大模型市场,竞争早已是不是红海,而是血海:
这些巨头们每个都有自己的流量入口,每个都有自己的天然生态。
Kimi 呢?
它什么都没有。
24 年,靠着超长上下文、靠着过年小游戏爆火。
尝试过买流量、做营销,甚至在营销圈,Kimi成了鲶鱼。
但现如今,用户已经认识了 AI ,市场也早就消退,营销CAC越来越高,效果越来越差。
特别是今年 DeepSeek 出来之后,神秘力量的海量流量衬托下,Kimi 没法玩了。
花再多的钱,在神秘流量面前,简直…
而且, DeepSeek 甚至有点颠覆了估值逻辑。
这怎么玩? Kimi 沉寂了下来,过程中,甚至有这样的消息。
毕竟,
没有生态、没有流量入口的玩家,要想在这个市场活下来,还想留在这个赛道,
就只能彻底押宝另一条路:
彻底开源,用开源换生态。
开源意味着什么?
就是自愿把自己花巨大成本训练的模型资产,免费放给所有人用。
风险很大,但我觉得Kimi 想得很明白自己的定位了:
他们的视野不再是卷国内模型,而是封锁中国市场的海外模型,比如 Anthropic 的 Claude。
换言之,他们想成为中国的 Anthropic。
怎么说呢?
我个人觉得非常正确且合理。
2024年开始,Anthropic 旗下的 Claude 以及其果断的姿态,彻底屏蔽了大陆 IP。
比如卡兹克,被封八回了。
昨天开始, Cursor 开始锁区,封中国 IP 了…
怎么说呢,就离谱。
一些国家就真的全面孤立中国呗。
一些投资公司的投资要求就是放弃中国大陆市场,要求某些团队从武汉迁移到新加坡。
那这个巨大的市场,你们不要?
海外模型封锁大陆市场,背后的逻辑可能是特朗普的要求,但实际上,它们却给了Kimi 一个意外的历史窗口期:
整个国内市场,都在迫切等待真正好用、可靠、能通过算法备案的 Agent 开源大模型。
这个巨大的需求空缺,给了行业机会:如果它能推出一个明确定位于企业工程化、工具调用能力强、长文本处理能力突出的模型,它就能一定程度上拿下市场。
Kimi 显然读懂了这市场信号,于是直接开源Kimi K2,把定位聚焦到“中国版Anthropic”上。
AI Agentic 模型,之前有 Qwen3,紧接着有 DeepSeek V3 0324,现在加上了 Kimi。
前几天黄仁勋交流会列举的三家公司:像DeepSeek、阿里巴巴、以及月之暗面等公司,在技术上都有很大的突破。
毕竟用开源 ≈ 需要显卡…
所以,这个市场你不要,那就…
这个市场站位我看懂了,那开源免费,企业直接部署不就完了吗,Kimi 靠什么竞争?
Qwen 开源,可以卖阿里云; DeepSeek 开源的初心是体现抱负;那 Kimi 是做慈善?
我在想,这可能就是Kimi 的核心战略:
它想做好编程场景,锁定模型背后的开发者生态,而不是单纯的模型能力赚个 C 端打赏。
怎么理解?
首先,企业用模型大概率是长期深度整合。
企业在模型上会持续投入大量的开发成本,插件、工具链、流程优化、数据沉淀,都是企业的长期沉没成本,比如最近 Tim 的视频分享中提到,不同公司采用不一样的软件,带来的工作流的变化,导致他们换软件的代价极大。
模型也是一样的。
模型越开放,企业越愿意敢持续投入。
企业的沉没成本越大,模型就越难被替换。
当模型开源的时候,它就永生了。
Kimi 开源的本质,就是通过开放性的免费模型,让企业用户愿意将自己最核心的开发成本持续投入到 Kimi 模型生态里,虽然这一次开源不意味着什么,毕竟企业也担心,万一你就开这一次咋办?
我还不如用 Qwen。
刚上百炼看了一眼,百炼直接集成了 K2 ,换言之,你只要有百炼 KEY,你就直接能用 Kimi。
不过,现阶段,企业能选的,确实也不多。
开源让企业敢于信任,模型得长期确定的能力、长期确定的生态、长期确定的成本可控,
企业信任了,生态就锁定了。
我猜,Kimi 想复制的,就是Anthropic在海外企业市场依靠生态、AI 工程化编程的崛起路径:
Kimi 正在学习 Anthropic 成功的逻辑,填补中国企业市场被封锁后的空白。
在这一次开源里,我发现了一个有意思的点。
Kimi K2 参考了 DeepSeek 之前开源的MoE技术路线:
根据 InfoQ 的消息,Kimi K2 的架构设计与另一款开源大模型 DeepSeek V3 高度相似,两者均对 Transformer 架构作了改进:K2 减少了注意力头数量以提升长上下文效率,同时增加了专家数量以提高 token 利用率。
这件事背后的逻辑很关键,我甚至觉得在一些站位上,它更高了…
这种剧本真的太多了…各行各业的剧本…
不夸张的说,可以讲一讲文化自信。
比如 Cline CEO 的推文,说明 Kimi K2 模型只要 Claude Opus 4 一折的钱。
嗯哼?
这么吹的吗?
甚至,在lmarena.ai上,Kimi 已经排第五了…
地址:https://lmarena.ai/leaderboard/text
※不同榜单排名有出入,所有的榜单仅供参考,请理性看待。
我觉得,虽然还在追赶,但 Kimi 这把能上牌桌已经相当不易。
如果不开源,可能完全没有这样的声量。
DeepSeek 的套路, Kimi 属实是玩明白了。
当然,Kimi 这次开源也不意味着可以开香槟了,毕竟:
第一,同质化风险依然巨大。
Kimi K2开源后,很快就会涌现出大量 Fork 或者 Post-Training 版本 ,Kimi 既然开放了,就得想办法在底层、模型、工具链服务继续卷…
走明确的一条路:AI 编程, AI Agentic 的路,建立真正差异化的优势,避免迅速被市场稀释。
毕竟开源又不花钱,当然哪个好用哪个。
很多模型开源时候是 SOTA ,比如百川、Yi,曾经都荣登 Leaderboard ,到后面慢慢沉寂。
你要开源,就得一直开源,不然就没啥意义。
第二,开源后的商业闭环得迅速建立起来。
因为开源,就意味着 API 收入会大幅减少,Kimi 得尽快搞出真正能赚钱的企业生态服务和工具链,实现商业闭环。
不然,模型免费、服务免费,长期烧钱很难维持。
比如 Qwen 开源,可以直接加入到百炼全家桶,开 mini - Middle , Large 闭源;
企业简单使用可以,想上好效果,就得买服务。
Kimi 可能也可以使用这样的逻辑, 好效果的闭源,常规的开源。
同时,应用端打磨好体验,比如 Kimi K2 的深度研究是很好的付费点,效果直逼 GPT o3,我最近都在给朋友安利。
这个产品就非常值得开启商业化。
第三,生态组织和持续投入压力不容忽视。
一旦开源了,就意味着,Kimi 要想办法维护好开发者社区,而现在看起来,还不成熟。
因为生态需要长期维护。
那 Kimi 就得持续投入大量人力和资源进行组织开发者生态、运营开发者社区,保证开发者在使用上,遇到的问题能尽快被基模团队解决,如果对开发者环境不友好,那么开源的成果就无法持续。
演进路线真·可以参考 Qwen 3 的百炼和魔搭社区。
这个国内的 Hugging Face,很繁荣。
那回过头来看Kimi 开源 K2 的这一步:
Kimi 用开源彻底压注了企业市场的长期确定性,也用好效果劝退了即将开源的别家模型。
但同时,开源背后的挑战和隐忧依然很大:
真正的竞争,早就不是性能、参数量的竞争,
而是生态的竞争,是抢夺开发者生态,做应用背后引擎的颈枕。
Kimi 下的这步棋非常难:
但它想要的,也远比我们想象的更大。
这,或许才是Kimi 开源破局的愿意。
祝 Kimi 顺利。
上面内容仅为个人观点,欢迎交流,轻些拍转。
欢迎关注,咱以后就是老粉了哦~
我是洛小山,我们下次见~
在线吃瓜深度研究提示词
https://www.yuque.com/u22687314/luoxiaoshan/xfnrykrs83ygsfmg
围棋需求文档
https://www.yuque.com/u22687314/luoxiaoshan/unrgtba3s3vhgmf0
文章来自于微信公众号“洛小山”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0