还记得Midjourney最早的视频功能V1上线时,一张图、五秒钟、高美感、低分辨,是所有人对V1的第一印象。
MJ这一次更新的两个功能,一个是老活新整,也就是很多视频模型都有的首尾帧功能;一个是新鲜的Loop玩法,本文章将深入测评两个新功能的实战效果,并将其与国内热门的AI视频工具“即梦”进行横向比较,看看“审美王者”这次在视频模型上又下了哪些功夫。
在Midjourney网页端,首尾帧和Loop功能的操作与图生视频的操作相同,都十分简单便捷,本部分主要详细介绍这两个功能在Discord端的玩法。
Start & End Frame 首尾帧功能:
●准备素材: 先准备好你的“开头”和“结尾”两张图。可以是你用MJ生成的,也可以是任何你喜欢的图片。
●复制链接: 把图拖进Discord,右键点击,选择“复制链接”。这个链接就是给AI的“导航地址”。
●念出咒语: 在对话框里敲下/imagine,大胆写出你的想法,然后把两个图片链接分别贴在--begin和--end后。
通关口令: /imagine prompt: [你的脑洞] --video --begin [第一张图的链接] --end [第二张图的链接]
Loop循环功能:
●找个好点子: 构思一个适合无限循环的画面,比如永不停歇的雨滴、缓缓飘落的花瓣,或者跳舞的火柴人。
●一键循环: 写好你的提示词,在最后加上--video和--loop。你想让它只循环几次,就在--loop后面跟个数字,比如--loop 3就是循环播放3次。要注意的是,任何参数(比如--loop或--sref)前后一定要加「空格」,不然会出现指令无法识别的情况。
通关口令: /imagine prompt: [图片链接]+[你的脑洞] --video --loop [想循环几次]
一句话总结:这两个功能操作简单,而且“不涨价”,堪称Midjourney目前性价比极高的一次更新。而且,Midjourney一次性生成四个视频,很大程度上减少了我们的抽卡次数,省时又省钱,唯一的缺点就是画质太低(苦苦等待优化)。
视频首尾帧转化过程中,主体变形和画面风格(如光影、色调)的变化常常会影响我们视频的观看效果,如果变化太突兀、不符合常理,很容易会让观众出戏,所以针对Midjourney和即梦的首尾帧功能,我们分别进行了变装测试和光影控制测试:
可以发现,Midjourney更擅长做主体发生改变的画面过渡,比如兔子变成老虎、男主变成钢铁侠。而即梦在这类处理上常常依赖“模糊+叠加”技巧,如果主体间差别过大,很容易出现变形,案例中甚至把labubu的邪恶微笑唇变成了兔牙……
通过测试结果来看,两者的效果都不算好,但也各有特点,比如Midjourney在首尾图像的衔接过程中更讲究逻辑,它会为主体设计一个适合的转变场景,而即梦的变化速度更快,不注重过程,更像是“滤镜”。
更换图片后再次测试,两者的测试结果又恰恰相反,这次是Midjourney变成了“滤镜”,而即梦的变化过程更加自然,看来想要驯服Ai的首尾帧,需要运气与选图并存。
在Midjourney的本次更新中,--loop循环功能无疑是一大亮点。在此之前,虽然有其他AI视频工具可以通过一些技巧实现循环,但Midjourney是首批将此功能作为标准化参数,并提供一键式流畅生成体验的主流模型之一。
为了测试Loop功能的真实表现,我们构造了一些典型场景:如“玫瑰在风中摇晃”:
雨滴从玻璃上不断滑落
宇宙旋涡不断转动:
从结果上来看效果很不理想,没有能真正实现官方说的无缝衔接的效果,尤其是运动物体晃动的形态、水的质感和漩涡的颗粒感都比较死板,首尾虽然在视觉上是“接”上了,但中间的过渡依旧生硬,一眼就能看出“AI接头”的痕迹,但如果是用在简单的产品动态展示上,这个功能还算过得去:
像实测视频一样,如果你的主角是静态产品,比如手表、灯具、陶瓷、饰品、包装设计等,Loop功能可以让背景动起来、光线缓慢流动,营造出“精致的动静结合感”。在这种低复杂度、高审美要求的场景下,Loop的技术短板不容易暴露,反而能突出视觉质感。
从“图动”到“首尾相连”,再到“无限循环”,Midjourney这次的视频功能更新显然不是一次孤立的尝试,而是希望我们越来越习惯让图片动起来。
从目前实测情况来看,不管是首尾帧还是Loop模式,都还有不小的进化空间,还在“长身体”的阶段。比起电影级别的商业视频,现在的Midjourney视频功能更适合被当作“动效草图生成器”,用于灵感捕捉、场景测试或品牌动图的快速出图,而不是期待它承担完整的叙事责任。
文章来自于“CMAI-Hub”,作者“谢蕾嫣”。