在AI工具间来回切换了1年后，可灵用一张画布终结了它。

7951点击 2025-07-29 10:57

这次去WAIC，论坛、探展直播、活动等等，硬生生干了个周末，几乎累麻了。

我自己这两天印象最深的，也是我觉得对我最有用的。

还是可灵的更新。

他们首发了1个全新的功能，灵动画布，还把之前的多图参考做了巨幅升级。

这两都挺酷的。

我当时在现场，录了一下灵动画布的发布，真的，发完以后底下掌声雷动。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

这个形态我当时看完以后，眼前一亮，确实非常的有意思。

特别是对于AI创作者来说。

当时论坛结束以后，我问他们啥时候能用，他们说一会闭馆了我们晚上回去让产品给你开，但是你要是急的话，可以去楼上的可灵展区先试试看。

然后我就去楼上了。

给我看懵逼了。

我拍了一下当时的展区的盛况。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

根本就特么挤不进去，我说我还是等你们晚上给我开吧，就掉头回酒店了。

晚上的时候，他们给我发了一句，可以用了。

果然，我登上去，发现已经开好了。

灵动画布在工具栏的最左边。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

点进来之后的界面，是这样的。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

其实你能看到，最大的三个功能，就是以模态为划分的，图片生成、视频生成、音效生成。

这个界面你可以先不用管，我们随便点开一个，比如图片生成。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

进去以后，你会发现，自己来来到画布界面，出现了节点。

左边是Prompt输入框，右边是可以选择的参数，比如模型、比例、多少张之类的。

中间用一个线给链接起来。

你只需要点一下立即生成。

他就会拉出一条新的线，链接到一块新的卡片上，而这些卡片，就是图片的生成结果。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

大概几十秒以后，四张图生成出来了。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

接下来，就是灵动画布这种画板式的产品，最棒的一点了。

在传统的可灵的UI界面里，如果我们想把可灵生成的图，用图生视频的方式生成AI视频的话。

需要点击这个生成视频。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

然后带着这张图，跳到了视频生成的界面。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

在对着一堆的按钮和参数，调完以后，生成视频。

但是我们都知道，做一个AI视频的片子，可能需要几百张图，几百个视频。

就这么来回跳来跳出，人会跳成智障，感觉自己是个跳跳虎，你很容易就迷失了，忘了自己的素材在哪里。

特别是所有的生成结果都堆在右边的结果栏里，图和视频混着排，我不知道你们，我自己是真的经常干着就找不到我之前的内容在哪了。

而在灵动画布里，就天然的适合做这种任务。

同样的，你可以把鼠标放在视频生成上，然后单击，就会出来两个关联的节点，这时候，这张图片自己本身和文本就作为素材节点，再加上参数节点，点击生成以后就可以直接生成视频。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

在这里面，你就可以切换模型，切换生成类型，还有一些几条、几秒等参数。

而新升级的多图参考，也在这个里面。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

素材节点+参数节点，就可以得到我们的视频生成结果。

同时，这个视频生成结果本身也是一个素材节点，后续可以用文本输入+视频参考的形式，给这个视频去加音效。

我们需要用到的，主要就是节点之间的排列组合。

比如文本输入+参数节点生成图片，比如图片&文本输入+参数节点生成视频，或者文本输入+参数节点直接生成视频。

其实底层逻辑和可灵之前的用法都是一样的，但是不同的是，它把每一个工作的节点拎了出来，让你在这个画布上就能够实时查看你的每一步工作。

我们还可以，微调Prompt，并行的开跑好几个任务，之前我经常这么干，就是为了要一个最好的效果，而现在，在画板上，并行会比传统的UI直观非常多。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

这个并发的感觉，究极壮观，强迫症患者表示爽飞了。

2分钟左右，视频跑完了，你还可以，给他们加音效。

最后，从文字到图片到带有音效的视频，就成了一个流。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

而且这个画布是无限的，也就是说，你在上面铺开一整个短片分镜也没关系。

如果画布太大，在画布上迷路了咋办？没关系，右下角可以缩放，随时会随时提示你正在什么地方。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

如果你的画布被弄得特别乱怎么办？也没关系，它有一个功能叫做整理画布。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

点击一下，咻的一下，页面又整洁了。

对于创作者来说，非常直观、方便、快捷，而且还极度可控。

我相信很多朋友其实都感觉到了，这玩意很像ComfyUI。

其实这种节点画布式产品，越来越成为一种主流的交互形态了，比如ComfyUI、扣子、百度的自由画布、Flowith等等。

这种形态，我觉得解决了一个我一直认为的AI工具生态化的核心难题。

产品间的孤岛化。

过去几年，其实AI工具发展得非常迅猛，但用户的体验却越来越破碎。

还记得2024年，我们生图用Midjourney、生视频用可灵、TTS用hailuo，生成完音频以后再扔回可灵做口型驱动，实在是太操蛋了。

标签上永远开着十几个网页。

也是后来我是在忍不了来回切换，搞了一个49寸的巨长无比的显示器，直接人工把所有的工具变成了节点式显示器画布，5、6个网页并排排列。

这边生成的素材我下载下来，然后传到另一个产品里面，然后生成完再下载下来上传到另一个地方，效率有提高，但还是难受。

节点式画布直接打通了这种孤岛，把多个不同工具和功能真正整合成了一个平台级的生态。

而且因为我自己是UI设计师出身，在很久以前就在用画布式的工具，比如Sketch、Figma、AI（Adobe那个AI）等等，其他大家也有一个很棒的点。

就是，我们真正在创作的时候，其实不是线性的。

创作一直是一种非线性、网状的拓扑结构。

我们的灵感并不是顺序产生的，而是随机、并发、发散出现的。

而这种产品形态，本身就非常的契合创作本身。

而可灵本身有生态级优势，图片、视频做的很棒，做这种进一步的创作工具，本身就是水到渠成的。

灵动画布上，还有一些小细节。

比如底下这个对话框，我在对话框里写一句提示词，点右边这只小笔，它就可以给我优化提示词。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

我在这个框里写了一句生成一只金毛犬，这是它刷刷刷给我写的，还直接给出了任务节点：

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

生成好的结果那一栏，也会有添加到对话框的选项。比如我生成了一张图片，就可以添加到对话框里，让它再做参考。

说实话，这比我之前用可灵要省事太多了，不用翻历史创作天荒地老，要什么东西直接一拖画布，就拿到了。

还有首尾帧，你把两张图直接拖进去，一框选，就可以直接生成首尾帧视频，或者直接多图参考生视频，也行。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

而且这个灵动画布，还可以多人协作，点击右上角的分享，就可以把自己的画布分享给别人。

也可以输入协作者的ID来添加协作者。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

目前最多能加五个协作者，对于一个短片来说，已经很够用了。

可以看到，可灵AI现在越来越想往生态、专业上去做出一些定义了。

并且因为内测中，所以还有很多功能不全，我整理罗列了一下。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

除了灵动画布之外，还有一个新升级的就是多图参考。

可灵的多图参考生视频是今年一月份出的，现在又来了一波更新，也可以直接在画布中使用。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

这次多图参考的升级，主要就是人物和角色更自然、一致性也更强了。

同时支持4张图。

并且，可以参考部分区域。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

可以参考主体，可以只参考面部、服饰等等。

让参考更加的精准。

我们用这个功能，玩很多的花活。

比如，肌肉男在麦当劳中举着卡皮巴拉深蹲。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

比如，让大卫和女孩一起在花园里散步，画风保持的非常完美。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

比如，两只猫一起玩毛球。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

非常的有意思。

用多图参考，保证一致性，我觉得才是用AI来做故事的起点。

除了多图生视频之外，多图生图也有很多花活。

在图片生成一栏，点参考生图——多图参考，就能看到主体、场景和风格三个生图维度了。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

这个界面，有点眼熟之前Google的whisk，都是依据主体 - 场景 - 风格来出图，不过可灵的自由度还要更高。

whisk每个维度只能放一张图，但可灵的主体这栏足足可以放四张图。

我直接用它生成了一个拼好饭的升级版，拼好购。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

还有喜闻乐见的邪门cp修罗场大乱炖。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

贼好玩。

做几个case我觉得也不是特别有意思，于是，有了一点小想法，我就花了一下午和一晚上的时间，用灵动画布和多图参考，做了一个小片子。

一个模特女孩的一天。

在多图参考生的模式下，一致性会强到非常离谱。

在AI工具间来回切换了1年后，可灵用一张画布终结了它。

我写完这篇文章的时候，已经凌晨两点了。

我看了眼屏幕上的灵动画布，满满当当的节点里堆满了我这一晚上的奇思妙想，突然有种莫名的满足感。

或许，我们距离真正的无限创作时代。

又更近了一步。

文章来自于微信公众号“数字生命卡兹克”。

关键词: AI , AI视频 , 可灵 , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales