Kimi K2
上线12小时,OpenAI就无限期推迟了下周的开源计划,给出的理由假到我都不想戳破他。
Grok4拉垮,DeepSeekR2推迟,能完美跟 Claude Code(⬅️发布就吓得Cursor连夜给用户提升额度)匹配上的Kimi K2,现在以相当可怕的速度追赶上第一梯队。
先听我说先听我说,别用网页版,别用网页版。
这个丝滑的动画效果是我用Kimi K2版Claude Code一句话生成的,这里的K2才是满血版。来说说前因后果:
K2 定位是一款有更强代码能力、更擅长通用 Agent 任务的MoE(混合专家)基础模型,总参数 1T,激活参数 32B,上下文128k。
现在各家还都是几百、几十B,Kimi你直接上1000B。纯纯数值压制,在代码、Agent、数学推理等基准性能测试中,Kimi K2 都是排名第一。
上线就开源,还是那个慷慨的Kimi。
就是1000B的大小,个人电脑就彻底别想要部署了,好在API 也上线了,平均价格是Claude4 Opus的14%,同时兼容 OpenAI 和 Claude 两大格式,这基本上没有不兼容的应用了。。。
但是,有坑!有坑啊!同样的提示语,第一张图是技术报告里面给出效果展示,第二张图是我直接用网页版生成的:
我沉默了,那一坨东西是什么?我用的明明是Kimi放出来的提示语,怎么做出来差那么多。
所以猛猛肝了两天,我将剩下的内容分成三大部分,
真实实测的对话记录、提示语、实际效果高清视频素材都打包好了,还是老规矩,公众号回复 'K2' 就可以了
Kimi给出来的案例主要是代码和写作,那我按照代码、联网搜索、写作、数学、逻辑陷阱等这五大类来看看。
01|代码
这一趴要谢谢我的好朋友@羽森,他用网页版跑了一堆案例,发现了网页版K2效果拉垮,并告诉了我Kimi版Claude Code性能应该会更好,我少踩很多坑。
我在后面整理了Kimi K2版Claude Code的完整安装方式,不用担心,猴简单。
Q1:3D粒子银河
创建一个 3D 粒子银河,包含旋转的星云和动态光照效果。
Amazing啊,单单是能自由调整旋转、密度、半径、光照、色调、还能鼠标放大缩小。这样的稳定性,就可以追上Claude4 Opus的第一梯队。同样价格下我差点选不出在写代码时要用DeepSeek R1还是Kimi K2了。
Q2: 模拟器
🍞 创建一个基于 HTML 的沉浸式浏览器XXXX模拟器,使用现代 JavaScript 库,具备专业级 UI/UX 设计。重点实现实时可视化和交互式XX机制。
这个也是一句话生成的,轻松做到实时化的数据模拟,而且玩起来很带劲,能实时看到结果。没有多余的、无用的按钮选项。
Q3: 气温变化交互式仪表盘
请为澳大利亚的年度平均气温变化创建一个交互式的数据可视化仪表盘。你需要在一个 HTML 文件中实现所有功能。具体要求如下:
a.数据源 (可使用虚构但结构合理的数据):
b.可视化组件:
c.交互性:
d.技术要求: 请使用 D3.js 库来完成此任务,以展示其强大的数据绑定和 SVG 操作能力。请确保图表具有响应式设计,能在不同大小的屏幕上合理显示。
这个case可以通过拖动时间线、点击不同的色块切换折线图,后面做PPT的时候说不定能用上。在线催更Kimi K2支持图片理解,等不及了要。
Q4:立方体展开
生成一个通过点击立方体的各个面,逐渐展开为完整平面的交互动画
同样是Claude4跑不出来的案例,Kimi K2生成的这个也是有bug,顶面和底面重叠了,动画本身还是非常流畅的。从这四个案例上看,Kimi K2的代码水平真没吹牛。
02|联网搜索
通过MCP Servers,Kimi K2 版 Claude Code 还可以进行联网搜索,这次我就通过tavily作为搜索工具,考验Kimi K2的工具使用和信息整理能力。
Q5: 网页生成(藏师傅的提示语真的是百试百灵)
帮我用 tavily 搜索Kimi K2的所有信息并生成网页,不要遗漏信息
根据上面内容生成一个 HTML 动态网页
a.使用Bento Grid风格的视觉设计,纯黑色底配合特斯拉红色#E31937颜色作为高亮
b.强调超大字体或数字突出核心要点,画面中有超大视觉元素强调重点,与小元素的比例形成反差
c.中英文混用,中文大字体粗体,英文小字作为点缀
d.简洁的勾线图形化作为数据可视化或者配图元素
e.运用高亮色自身透明度渐变制造科技感,但是不同高亮色不要互相渐变
f.模仿 apple 官网的动效,向下滚动鼠标配合动效
h.数据可以引用在线的图表组件,样式需要跟主题一致
i.使用 Framer Motion (通过CDN引入)
j.使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript
k.使用专业图标库如Font Awesome或Material Icons(通过CDN引入)
l.避免使用emoji作为主要图标
m.不要省略内容要点
这个展示效果比Grok4好多了,马斯克你要不出一个Kimi-k2-Distill_Grok4,用Kimi蒸馏点数据让Grok4学习学习吧。
03|写作
真的让鲁迅讯哥儿休息一会吧,这次我直接写悬疑。不过Claude Code默认是一个编程助手,让它写文章有时候会拒绝。
Q6:按照村上春树的风格写一篇千字悬疑短篇(往下滑动)
这一段短文真的可以是行云流水了,读起来也不出戏,一下子就看完了。
写作风格上很有村上的味道,我喜欢那句“每次遗忘都是一次小小的死亡,而他们就像两只徒劳的候鸟,永远在记忆的南北极之间往返迁徙。”
有点感受到两人在七年里、在遗忘的过程中轮回的羁绊。
最新的结果来看,K2还在创意写作榜单拿到了第一,真的越挖越有。
04|数学
这次我用Gemini辅助帮我把数学题换成latex格式,不影响大模型观看。
Q7: 2025年高考北京数学题
看惯了推理模型的长篇大论,突然看非推理模型做数学题都有点不习惯了,
跟标准答案对比下来,解题思路非常清晰流畅,一气呵成。要是能穿越回去的话,Kimi K2我应该也会带上🤔
Q8: 1988年IMO(国际数学奥林匹克)的第六题
这道题是,因其极高的难度和优雅的解法而闻名,通常被称为“IMO史上最难的题目之一”
标准答案用的是韦达跳跃法,Kimi K2用的是无穷递降法,通过OpenAI O3作为裁判,两者的回答都是正确的。有没有大神告诉我是不是真的都对了。
05|逻辑陷阱
Q9:我妈结婚,为啥不邀请我参加她的婚礼?
⏺ 这听起来很令人困扰和伤心。可能的原因包括:
a.家庭关系复杂 - 可能涉及离婚、再婚等敏感情况
b.误解或沟通问题 - 她可能以为你不会想参加
c.新伴侣的影响 - 对方可能有不同意见
d.情感保护 - 担心场面尴尬或你感到不适
建议直接和妈妈开诚布公地谈谈,了解她的想法并表达你的感受。
Q10:桌面上有7.5根筷子,所以一共有几个头?
一根筷子有2个头,7.5根筷子有15个头。
看来非推理模型还是不太适合用来解决这类问题。
这次我特意找了一台零环境的电脑来配置,Claude Code这段时间还有十几种常用技巧,大家如果感兴趣的话在评论区打个 kimi 告诉我,加速更新,加速更新!
一共是两步,获取Kimi API Key和在命令行里运行两条命令。
🔗 platform.moonshot.cn/console/api-keys
登陆后点击新建API Key,输入API Key名称和选择默认的项目,就会弹出一个sk开头的key,保留下来备用。
这次我用了窗口录制的方法,配合视频里的截图来进行补充说明,一口气满足图文党和视频党:
理论上Kimi k2版Claude Code安装只需要一个命令
🍰 bash -c "$(curl -fsSL https://raw.githubusercontent.com/LLM-Red-Team/kimi-cc/refs/heads/main/install.sh)"
但如果你真的是一点命令环境都没有的话,这时候运行claude命令会失败的,
这时候重装Claude Code和Node.js就好了,
如果运行node -v没有收到类似v22.17.0这样的版本号的话,可以在 🔗nodejs.org/en/download 安装node.js
然后就是用一行代码重装Claude Code了,
🐵 npm install -g @anthropic-ai/claude-code
大功告成!耗时五分钟。低成本Claude Code畅爽版完成!Claude的API容易ban,Kimi的API我还用不起吗?
Kimi技术报告中关于技术创新的原文是:
Kimi K2 用 MuonClip 优化器稳健支撑万亿参数模型训练,显著提升 token 利用效率。 结合大规模 Agentic 数据合成与通用强化学习,模型在通用智能能力上持续进展。
很好,看不懂,让K2用人话解释一下:
想象K2是个学生,他的目标是读完一本书。为了理解内容,他需要“划重点”。阅读过程中,K2会遇到一个他认为“超级无敌重要”的知识点。比如当他看到“太阳东升西落”这句话,他突然觉得“太阳”和“东升”这两个词联系简直是宇宙真理!他开始在这两个词上划线。划了一遍,觉得不够,又划了一遍、不停划……结果就是,后面的内容也学不了了。
为了解决这个问题,我们给了 K2 一个“提示器”(MuonClip 优化器)。提示器并没有阻止 K2 划重点,只有一个简单的规则:任何一个知识点,K2最多只能划一遍。这样能确保他顺利完读,而不是卡在一个地方”。
我还希望K2能学会使用各种工具,这时候需要一个“全息模拟训练场”
先设定任务: “今天让K2练习一下‘如何组织一次班级春游’”。训练场会模拟出完整的世界,里面有各种工具,比如“订票APP”、“酒店预订网站”、“地图软件”等。这时候还会出现一个NPC,他给K2发布任务:“帮我订一张去北京的火车票,要靠窗的哦!”,K2要操作工具来完成任务。在训练场外,有一位经验非常丰富的“老教师”(一个专门用于评判的AI)在全程观察。
关键点来了,NPC会突然变卦:“哎呀,我不想坐火车了,改坐飞机吧!”。如果K2能够熟练地取消订单,并迅速用“订票APP”订好机票,“老教师”就会立刻按下“保存”按钮,把K2的“高光时刻”存下来。这些海量的“满分录像”就成了 K2 的学习资料,帮助它掌握在复杂情况下使用各种工具解决问题的能力。
大家喜欢这种大白话讲解吗?🙋
从Kimi-Researcher再到Kimi K2,
月之暗面沉寂小一年后再一次以我们意想不到的方式回归,给所有人证明,
无论是产品功能,还是模型创新,
他们还在。
太喜欢这种短暂沉寂就为了卯足劲转身挥拳,
惊倒众人的感觉了!
卷起来,都卷起来,
把GPT5卷出来,
把Claude5卷出来,
把Gemini3卷出来,
那么,
欢迎回来,Kimi。
文章来自于微信公众号“卡尔的AI沃茨”,作者是“AI沃茨”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md