Nano banana 爆火之后,果真催生了很多 App。
这些 App 的创意目前都还是仅停留在对照片的编辑上,而没有探索进一步的玩法。
App Store 上搜索 nano banana 出现了多款应用
而且,体验 nano banana 官 App 只在 Gemini 上。Google 副总裁 Josh Woodward 发 X 提到这个香蕉模型为 Gemini 带来了一千万的新用户,累计完成了 2 亿次的图像编辑。
我们在之前也更新了 nano-banana 小白速通指南,提供了多种测试案例,官方也下场给了一份详细的文生图,提示词指南。
但是,光停留在图像编辑,创意还是稍显不够;现在拿 nano banana 来生成视频,才是真的好玩。
我们汇总了社交媒体上有趣的视频案例,包括下面这些玩法。
1、视频也能 P 图: 不只是图片,现在视频也能轻松实现一键换脸、换装、换背景。
2、照片变大片: 只需要给 AI 一张「开头」和一张「结尾」的图,它就能自动脑补出中间的完整视频。
3、无缝转场: 用 AI 生成风格一致的转场图,把几个不相干的短视频也能丝滑地拼接成一个故事。
4、AI 自动运镜: 扔一张静态图,就能自动生成 360° 环绕、推拉摇移等各种电影级镜头。
「逐帧替换」,一致性延伸到视频
视频就是由一张张图片组成的,一个标准的 24-30fps 视频,每秒钟就包含数十张图片。
理论上,将视频拆解成帧,交由 nano banana 逐一处理,再重新合成,就能得到一个风格或角色完全统一的新视频。
但 nano banana 的表现不是每次都能 100% 完美的,Higgsfield 给出的解决方案特别惊艳。
https://x.com/minchoi/status/1960930867150266663
凭借着 nano banana 强大的一致性保持能力,Higgsfield 能根据修改后的图片,继续生成视频。
在这个案例里,把《绝命毒师》的小粉和老白,直接换脸小扎和马斯克,毫无破绽。
https://x.com/minchoi/status/1960930869184466995
https://x.com/minchoi/status/1960930865170600347
https://x.com/teejayoffl/status/1960562462811443476
这些人脸的替换,可能动作幅度比较小,相对来说是容易替换;但是下面这个跑步的视频,确实把我吓了一跳。
https://x.com/minchoi/status/1960930861466914820
真的太像了,和原视频一点都不突兀。
这种替换不止于人脸。视频中的任何元素——服装、道具、天气,乃至整个场景风格,都可以成为我们再创作的对象。
例如,FREEEPIK 的演示视频就展示了,应用内的可视化提示词操作。我们可以像修图一样选中画面中的物体,直接用文字指令将其替换。
https://x.com/jerrod_lew/status/1962579292614771014
还有,万物皆可替换为香蕉。
https://x.com/teejayoffl/status/1960562147001352197
首尾帧的玩法是目前 nano banana 比较热门的视频测试,而且大多数的视频生成模型,都提供了首尾帧的功能。
这个由 nano banana 和可灵制作的视频,生动展示了在冰天雪地里与敌人激烈的战斗。
https://x.com/koldo2k/status/1962248178662564012
同样,画面的元素调整、天气光影的流转、拍摄视角的推移等,都可以通过定义首尾两帧,以视频的形态动态呈现。
https://x.com/jerrod_lew/status/1961646102522073370
还有这个 18s 的变身视频,也是先利用 nano banana 生成了多张图片,然后在海螺里指定首尾帧,再进行拼接。
https://x.com/markgadala/status/1962553379147694500
如果你也想试试,博主给出了具体的步骤:
1. 首先使用 nano banana 创建一个场景开始帧,或者给定一张已有的图片。
2. 重新上传选择的场景开始帧图片,使用它来创建一个结束场景,提示词的内容最好控制在 5s 内能产生的变化。
3. 然后到海螺、可灵、Veo 2 等视频生成模型,创建使用首尾帧的视频,并按上一步的顺序排列。同时需要尝试调整提示词,以获得场景中所需的精确过渡效果。
4. 然后只需将生成的视频组合起来,就能得到一个完美流畅、长篇的 AI 视频场景,同时角色保持一致!
只要创意足够,用这种方法制作一部小型连续剧也并非不可能。
X 上有位博主分享了一段长视频,以第一人称骑马视角,带领观众穿越中土世界。
https://x.com/techhalla/status/1962292272227102941/video/1
他说自己用 nano banana 生成了 38 张关键帧图片,通过不断重复首尾帧生成的流程,拼接制作而成。
最近,Flowith 团队基于 Nano Banana 制作的模拟人生游戏 Flolife 也带来了新的灵感。
游戏会生成人生各个阶段的照片,我们将这些照片作为关键帧,便生成了一段浓缩的「人生视频」。
这里由于 Google Flow 有比较严格的规定,不能上传未成年、名人等照片,所以我们使用拍我 PixVerse 实现了多帧生成。我对这个效果非常满意,它真实地为个人生活记录和创意表达,提供了充满温度的新可能。
首帧是产品图,尾帧是 nano banana 生成的产品结构图,指定这两张图片,就能得到一个酷炫的产品爆炸视频。
https://x.com/AIimagined/status/1960857739279917131
以前广告商做一个类似的视频,可以需要通过复杂的建模和视频编辑,现在就是一个指令。
参考提示词:Exploded view of a DSLR showing all its accessories and internal components such as lens, filter, internal components, lens, sensor, screws, buttons, viewfinder, housing, and circuit board. Maintain red accents of the DSLR.展示所有配件和内部组件的数码单反相机爆炸视图,如镜头、滤镜、内部组件、镜头、传感器、螺丝、按钮、取景器、机箱和电路板。保持数码单反相机的红色强调。
我们也用 nano banana 生成了一张 iPhone 17 的产品爆炸图,然后使用 Veo 2 的首尾帧功能,制作了一段 iPhone 17 的视频。
不只用来指定首尾帧,nano banana 生成的图片还很适合用来转场。
这段动画是由 Seedance 1.0(字节跳动的视频生成模型) 和 Nano Banana 两个工具来实现的,Seedance 负责动画化镜头,而 Nano Banana 则是让视频里,疯狂的跳跃剪辑成为可能。
https://x.com/0xFramer/status/1960720090921623636
主要的步骤是,先找一张图片,使用 Seedance 将这张图片变成 2-3 个场景(视频),接着在 Nano Banana 中创建转场图片,因为 nano banana 可以很好的保持人物一致性,所以用来转场是再合适不过。
第三步是将生成的图片反馈回 Seedance,然后再回去重复步骤一。和首尾帧类似,不过这里主要是指定首帧来生成,这需要对提示词有更准确的描述。
像是我们也使用博主提供的这张初始图片,经过 nano banana 处理,在 Google Flow 里面生成了一段视频。
故事的内容是这个小伙子修好了自己的摩托车,开到了海边,看着大海,对未来充满了希望。尽管提示词经过 Gemini 优化,但仅指定首帧,转场好像还是有点连接不上。
和指定视频的首尾帧不同,这里使用的是 Midjourney Frames(Midjourney 帧) 的功能。
https://x.com/nimentrix/status/1960771904794714311/video/1
还有这个视频,从 Midjourney 中找了两个人物角色,然后要求 nano-banana 根据给定的人物角色,制作一张图片,其中男人在女人前面,正在给她拍照。
在 Midjourney Frames 中使用这两张图片,提示词是「这个男人在给那个女人拍照」,就能得到一个运镜自然的视频。
https://x.com/nimentrix/status/1961349774830940345
除了 Midjourney Frames,Higgsfield 的运镜功能同样出色。
像是这个输入一张滑雪的照片,能直接生成一个 360 度预览的 3D 模型。
https://x.com/jackcoder0/status/1962712152307048714/video/1
还有《人生切割术》里面的马克扶着打印机,镜头从上到下,慢慢旋绕推进。
https://x.com/jackcoder0/status/1962712285119684900
还有网友通过提示 nano banana 生成多个广角和特写镜头,一个时装秀就这样自然地诞生了。
https://x.com/CoffeeVectors/status/1962217569374425510
过去我们生成视频可能完全依靠提示词,而现在的「提示词」完全可以说,就是 nano banana 生成的图片,这对视频创作来说确实是一个很大的进步。
但视频生成的费用比图片生成贵太多了,大多数的模型收费都比较高。文章中提到的 Higgsfield 和 FREEPIK 等工具,免费使用的机会都非常有限。
Google 的视频生成工具 Flow,前些天也向全部用户公开,新用户每个月可以领 100 积分,使用 Veo 3 - Fast 模型(不能指定首尾帧)每生成一个视频是消耗 20 积分,Veo 2 - Fast 是 10 积分,感兴趣的小伙伴还是推荐去试试,地址就在 flow.google。
拍我 AI 首页,全场生成免费,截止到 9 月 10 日。
此外,拍我 AI(PixVerse)也在今天(9 月 5 日)开启了为期六天的限时免费活动,我们在之前测试过它的最新视频生成模型 V5,表现确实不错。这次,拍我也率先嵌入 nano banana,上文提到的这些案例,创意小短片、让手办动起来,拍我都能直接生成。
文中其他工具体验链接:
自由换脸:https://higgsfield.ai/
视觉提示:https://www.freepik.com/
模拟人生:https://www.flolife.me/
拍我AI:https://pai.video/
nano banana:https://ai.studio/banana
文章来自于微信公众号“APPSO”,作者是“发现明日产品的”。
【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。
项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file
在线使用:https://aicomicfactory.app/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0