
Kimi 刚刚发布了 K2.6,Agent 模式也同步大升级。
这是用 K2.6 Agent 做的 AI 产品打榜站,一次性生成了配套视频动效的 UI。

要求其开发坦克大战游戏:

在没给素材,没指定技术方案的情况下,直接开发出了可玩版本(包括游戏画面、字体、8-bit 音效)

并且无需运维,直接开发出了的「联网对战模式」:

整个 Vibe Coding 过程,无需强调设计方案、不用了解开发运维,开箱即玩。
总之,本次 Kimi 新模型、Agent 模式,在全栈开发、设计效果,又往前了一大截。
Kimi K2.6 模型,已全面上线 kimi 官网、APP、API,以及 Kimi Coding Plan。

K2.6 的通用 Agent、代码、视觉理解等能力,得到全面提升。和常见模型的榜单对比如下:

尤其对于复杂端到端 Agent 任务,在 Kimi 内部基准评估中,K2.6 相较于 K2.5,成绩提升约 20%。
这是官方跑的一个复杂任务:
让 K2.6 在 Mac 环境下,自行下载并部署 Qwen3.5-0.8B 模型,并利用小众 zig 语言优化模型推理。在 4000+工具调用、12 小时不间断运行后,K2.6 将模型迭代了 14 轮,大幅提升模型吞吐量。

在我自己的实际测试中,K2.6 的 Agentic 主动思考、长程执行能力,也确实不输海外模型,在日常任务中表现出了很多惊喜。
上下文窗口为 256k tokens,价格方面,较 K2.5 略有变化:

比起模型更新,更有意思的是他们同步更新的 Kimi官网内的 K2.6 Agent。

主打升级前端审美和打通数据库能力。
前端审美方面,新增了对图像、视频生成工具的调用。K2.6 Agent 现在能够生成视觉风格统一的素材、搭建首屏区,并实现各种交互元素和滚动触发动效。
具体的,支持以下前端技术栈:

后端方面,也提升了全栈开发场景能力,Agent 可自行接入后端数据库。
可以创建能记录活动报名的落地页(并在后端数据库模块中查看报名信息),为餐厅网站提供预订信息能力,甚至开发联机游戏。
这就意味着,K2.6 Agent 更擅长一件事:让 0 经验的人,也做出一个好看、完整的网站产品。
在 K2.6 提升 Agentic Coding 能力,以及 Agent 模式高度集成 Coding 所需能力模块后,在一般消费级开发场景,用户不需要思考选什么技术栈、素材从哪来、后端怎么接、网站怎么上线了。
这些原本要人工一环一环串起来的事,Agent 能一次性完成了。
一张图、一个视频学习网站设计,从 K2.5 以来就表现不错。详见我上次「实测 Kimi 新品:前端设计,追平 Gemini 3 Pro」
本次更新后,该项能力得到了进一步提升。从知名设计网站「awwwards」找了一个优秀网站,将其设计录为动态视频,并要求 K2.6 Agent 学习 ⬇️


原网站录屏

K2.6 的复刻效果
在多次实测对比后,确认 K2.6 Agent 在前端设计表现如下:


总结一下:K2.6 Agent 支持多模态参考,输入参考图/视频,即可转为类似设计。推荐使用 K2.6 迁移喜欢的网站排布、配色等。
紧接着是全栈游戏场景,从以往测试 Flappy Bird,到现在提升任务难度,这次我打算让 K2.6 做多关卡联网游戏开发,即一句话做坦克大战。

没给素材,也没指定技术方案,K2.6 Agent 直接做出了可玩的单机版。

游戏内的场景、视觉素材、音效的集成度极高,都是由 K2.6 Agent 自己搭配出来的:

(所以说 K2.6 模型在长程 Agent 任务中的高度自主思考能力是真的很棒了)
另外,本次 Agent 模式升级了后端联网能力,我亦要求其追加联网对战模式:

这是 K2.6 Agent 自行追加的联网模式,一次性做好了房间匹配系统的交互(自动创建房间号,最高 4 人加入房间、玩家名称与房内等待)、公网实时 PvPvE 模式与胜负判定逻辑。(网络优化尚有卡顿,对卡牌类弱即时要求的游戏,效果更好)

再回归到更常规的场景,做一个可以实时投票、留评论的 AI 产品打榜站。同时测试 K2.6 Agent 本次升级的视频生成、后端数据库、基础前端设计能力。
(同理,你也可以用它来做一些预定、报名、留资场景的实用性网页)
我选择给了较为完善的产品需求 Prompt,并要求其为该榜单做配套好看的落地首页 ⬇️

在实际使用中,如果没有特殊想法,也可以一句话让 K2.6 自主根据你的「一句话」,完善需求考量。
K2.6 Agent 给出的落地页效果:

包括一个 Hero 区域动态视频,大幅提升站点 Landing 的视觉体验,以及「查看完整榜单」入口、实时展示各赛道投票情况的页面组件。
如果你想给自己 Vibe Coding 网站也做出类似的 Hero 区域动态视频效果,可在 Prompt 添加类似提示:
在页面 Hero 区域配置 Hero 区动态视频,提升网站视觉效果。请根据站点定位、目标用户,生成我们期望的背景视频,并直接加载网页里。
或者给出更直接的视频生成提示:
Hero 区背景视频:「纯白灰色渐变背景从#FAFAFA过渡到#F0F0F0,画面中右下方漂浮着三个半透明的液体玻璃有机形态,缓慢变形,玻璃表面有微妙的虹彩折射和淡彩虹衍射,左上方的柔和工作室灯光在玻璃表面形成柔和的高光和阴影,变形运动极其缓慢且流畅,如轻柔呼吸,构图极简,尤其左右和上方留有大量负空间,无文字、无标志、无可识别物体,纯粹抽象半透明材质美学,超洁净的编辑杂志风格,宁静而精致的氛围,无缝循环,8秒,慢动作,照片级真实玻璃渲染」
进入榜单页面,可查看实时评分、评价。

任何人可打开产品评价表,填写自己的评价。
并且用浏览器指纹(FingerprintJS)+ localStorage 实现了防刷机制:同一设备 7 天内不能重复评价同一产品。

用户评论会实时更新到右侧评价面板,并按最新评分更新得分与排名。


一次性完成了全栈开发,完成度高,设计语言统一。
对于零开发经验的小白用户来说,大幅降低了 Vibe Coding 的入门门槛,能让更多人“一句话”做出自己需要的网站产品。
从 K2.5 到 K2.6,仅 2 个月的时间,Kimi 模型 + Agent 模式在 Vibe Coding 场景的能力愈发清晰:
凭借 Kimi 系列模型的主动思考与长程任务执行能力,以及工具完备的 Agent 模式,从「生成好看的网页设计」,走向「自主设计、开发更为完整的全栈产品」。
对于普通用户来说,「一句话做产品」也变得越来越可行:

综上 K2.6 在 Agentic 任务、网站设计方面表现出色,值得一试。
文章来自于"一泽Eze",作者 "一泽Eze"。
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0