
OpenClaw 爆火之后,我一直在想一个问题:
如果把 AI Agent 当作一个员工来看,未来最重要的能力是什么?
25 年我们谈到 Agent,几乎都在讨论一件事:执行能力。它能不能写代码、调用工具、自动完成任务。
OpenClaw 的出现,把这种能力推到了一个新的高度。它让人第一次真正看到:AI 不只是会聊天,它可以像人一样动手完成工作。
但在和 Muji 聊天的时候,我突然意识到:如果 Agent 真的会成为一种数字员工,除了执行能力,它可能还需要另一种同样重要的能力:审美判断力。
之前我分享过一篇文章《AI 行业最被低估的武器,是审美》,发布之后,讨论非常多。
原因其实很简单。
当 Coding 的门槛被 AI 大幅降低,当文生图、文生视频的内容生产能力被无限放大,一个新的问题开始出现:内容开始爆炸式增长,也在迅速同质化。
在这种环境里,真正稀缺的就不再是生产能力,而是注意力。品牌能否通过 Taste 和审美建立记忆点,与用户产生共鸣,开始变得越来越重要。
但这里的「审美」,其实是一个很容易被误解的词,没有所谓的 benchmark。视觉冲击力和好看只是其中一个衡量维度。
审美其实是非常私密的一件事。它深深绑定着一个人的记忆、经历和语境 。它既高度个人化,又不断变化。也正因为如此,审美可能是AI 最难真正理解和构建的一种 context。
在商业世界里,审美更重要的是另一层能力:
换句话说:好的设计,本质上是一种信息组织和呈现能力。
而如果把这个问题放到 AI 设计上来看,会发现一个很有意思的现象。
过去两年,AI 设计几乎等同于文生图。但在这条主流叙事之外,另一种 coding-based 路径的 AI 设计也正在悄然出现,类似于前段时间挺火的用 claude code 制作 vibe motion。
第一条路线,是继续追求更惊艳的视觉表现,Midjourney、Nano Banana 等工具都在这条路上狂奔。
第二条路线,则在解决一个更现实的问题:如何把内容,直接变成一份可编辑,可交付落地的设计文件。

国内恰好也有团队在做这件事情,之前也上架过「观猹」,Seede AI 评分一直稳定在 7 分以上 。并且在没有投放的情况下,这款产品靠口碑传播,半年悄咪咪积累了 10 万用户。我们团队也关注他们很久了。最近刚刚发布了海外版本 Veeso AI 。
我翻了一圈观猹上的用户评论,看到一条评论很有趣:

它在做的事情其实很简单:用 AI 把你的想法、文案和信息内容,直接变成一份有清晰信息层级的设计作品。
在我的理解里,Seede AI 输出的不是图片,而是一个 90 分的可以修改的完整「设计」稿:
如果你的设计能力一般,可以直接用,就是一个大家都觉得很不错的作品;如果你的设计能力非常强,可以直接微调,就是一个 100 分的作品。
这很不一样。

「生成图片」和「做设计」,其实是两件事。
之前看 Seede AI 联创 Muji 在活动的分享,他说了一句话让我印象很深:
「很多人觉得文生图画得华丽就是好设计。但在我看来,那是绘画,不是设计。」
怎么理解?
比如,这是我用 Nanobanana2 给 OpenClaw 设计的一个海报:

Nano banana2 生成的图,第一眼看确实精美,因为它元素丰富、信息密度高、视觉冲击力强。但当你真正开始阅读的时候,会觉得拥挤、压迫,甚至有点吃力。
问题不在于它画得不够好,在于它没有被「设计」过:
它堆叠了大量视觉元素,却缺少清晰的层级和节奏。没有视觉动线引导你第一眼看哪、第二眼看哪、最后落在哪。
同样的提示词,如果用 Seede AI 来给 OpenClaw 设计一个海报,体验完全不同。

因为真正的设计,核心目的只有一个:沟通。
做一张活动海报,不是让人夸好看,是让人一眼看清时间、地点、报名方式,产生行动的冲动。用户真正想要的,是一个不需要写提示词的 AI 工具。
所以 Seede 的逻辑从一开始就不一样。它让 AI 来当那个设计师:
帮你快速、完整的理解你的意图。你给它一段活动介绍,它不仅是在「画一张活动海报的图」,而是在帮你做设计:它会理解你的文字层级、语义结构,自动完成排版,生成一份真正可以继续工作的设计文件。
它生成的内容,是一个设计文件:文字可以改,图层可以动,图片可以换,布局可以调,还可以导出 PSD、PPTX、印刷级 PDF。
图片是终点。设计源文件是起点。
这是 Seede 和所有文生图工具之间,最根本的差异。
理念很美好,效果呢?
说实话,一旦体验了一次,就再也停不下来,因为 Seede AI 的效果非常惊艳。
「用 Seede AI 做一个招聘长图」
Seede AI 的完整创作流程只有几步,通用的五步是这样的。
第一步,选一张参考图,控制视觉风格。你可以选择任意版式作为参考,用于控制整体视觉方向。

第二步,粘贴文案、上传素材。
这里有个关键点:不需要写提示词。你只需要把人物照片、产品图这些素材上传上去,然后把你的文案内容贴进去就行。

第三步,选择模型,等待几分钟。
Seede AI 提供了丰富的模型选择,我个人的感受是,默认的 Kimi K2.5 和 Gemini 3.1 审美都不错。选择好之后点击生成按钮,它会自动排版、自动分页、自动匹配视觉层级。

第四步,微调修改。
Seede AI 生成的是一份设计文件,不是一张锁死的图,你可以任意换字体、换图片、移图层、改颜色,所有元素都可以调整。


第五步,导出源文件。PSD、PPTX、印刷级 PDF,想要什么格式选什么格式。

整个流程跑下来,我最大的感受是:
Seede AI 真的把用户当成「提需求的甲方」来对待,而不是一个「会写提示词的设计师」。
「用 Seede AI 做一个活动宣传页」
最近 OpenClaw 爆火,我们团队顺势推了一个「龙虾到家」的活动,需要一张宣传海报。
我正好拿这个真实需求来测测 Seede AI。
我把当时写的公众号的文案作为素材丢给 Seede AI,然后简单描述我的要求。

点击生成按钮,一个非常精美的海报就做出来了:设计精美,官网、二维码都有。

「用Seede AI帮我做一个 PPT」
我在深度使用这个产品前,以为只有个体户、设计师、电商运营之类的工作和岗位,才会用这个产品。
但当我深度体验后,我觉得普通人的日常任何关于图片设计的需求,都可以找 Seede AI 来做。
有意思的是,我看到观猹上有人拿它来做 PPT:

于是我也打算尝试做一个 PPT,看看它的效果:
我把最近爆火的文章《2028 全球智能危机》的英文原文给到它。

生成的效果有点惊艳到我:完全遵循了我给它的输入要求。
并且生成的内容还可以二次编辑!这是很多一键生成 PPT 产品都没有的体验。

测试过程中,我有个好奇:Seede AI 为什么可以做到这些呢?
于是我翻了一些资料,然后大概理解了它的一些技术逻辑:
Seede 设计了一套独特的自研 Agent 设计架构。它能基于自研的智能渲染引擎,用代码精准控制排版,在生成过程中,它会自动识别文字层级、重点、语义结构,然后匹配布局、配色、层级,生成一套完整设计。
所以它的文字永远清晰可读、排版精确可控、汉字不会变成乱码。比如下面的这个报纸,也是 Seede AI 生成的,可以看到所有文字都准确(PS:报纸内容是虚构的文案)。

这一点,即便是强如 Nano banana 2 也没办法做得很好。
你用它生成一张带中文的海报,十有八九会出现奇怪的字形或者干脆变成乱码,比如刚刚生成的效果,如果你看细节,会发现有很多问题。

当然,目前它在某些复杂排版场景下还有优化空间,但作为 v1 阶段的产品,Seede AI 的完成度已经很高。
写到这,我想套用一句老话:艺术可以天马行空,但设计必须在规则里创造美感。
大模型的审美可能没办法超越人类最顶级的设计师。但它掌握了世界上工业级的设计能力。 而 Seede AI,正在把这个能力开放给所有人:
全球有超过 10 亿 Office 用户,这些人会写文档、会做 PPT,但缺乏将内容转化为专业设计的能力。
Seede 要解决的正是这个缺口:让每一个只会写文档的人,一分钟内把内容变成专业级设计作品。
我们每个人都可以用 Seede AI 来帮我们创造一些具有美感的设计。

AI 设计正在分化成两条路。
一条是追求更惊艳的视觉。更强的风格,更复杂的画面,越来越像艺术创作。Nano banana、Midjourney 都在这条路上狂奔。
另一条是回到更现实的问题。怎么把内容变成可以继续工作的文件,怎么让不会设计的人也能高效产出专业物料。
Seede 选了后者。
于我,我觉得两条路都很有价值。但我觉得第二条路有它独特的优势。
作为模型爱好者,我认为第二条路可以把第一条路的最新成果为己所用,第一条路上的突破随时可以被整合进来。作为用户,我更期待的是一个可以二次编辑的设计产品。我觉得他们赌对了。
说到这,我在畅想 Seede AI 的下一步会是什么。
我想,可能是这样的:
第一步,是风格预设。既然大多数人脑子里没有明确画面,也写不出复杂的提示词,那就把风格直接做成可选项。用户只需要内容 + 风格,一键 Remix。
第二步,是创作生态。让那些有审美、有表达能力的用户去创造更多模板和风格,形成一个共创社区。普通用户不需要从零开始,只需要在这些风格基础上进行二次创作。
第三步,是AI 记忆。 当 AI 足够了解你的偏好、风格和业务场景之后,连模板都不需要选择。你只需要输入需求,AI 就会像一个长期合作的设计师一样,直接给你几套符合你审美的方案。

目前 Seede AI 正在实现前两步:
不止是让 AI 当一个专业的设计师,更是一个完全懂你的设计师。懂你的需求、偏好、业务、风格。
就像一个跟甲方混熟的乙方,不用你开口就知道你要什么,相处起来非常舒服。
用了一段时间,我发现我已经无法离开这个产品。
悄咪咪说一句:今天公众号封面的图,就是用 Seede AI 设计的。
而 Seede AI 常常会给使用它的人一种幻觉:
在某一刻,你好像突然成为了一个专业的设计师。
幻觉背后,2026 年 AI Agent 的设计正在发生一些真实的变化:
过去,AI 生成一张图片,到此为止。
现在,AI 生成一份文件,设计从这里才真正开始。
最后,感兴趣的朋友,可以来观猹的「瓜棚」板块,领取 Seede 的 50 积分~!
瓜棚:https://watcha.cn/shop

文章来自于“特工宇宙”,作者 “特工小镜 特工小天”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0