最近,AI圈又悄悄扔下了一枚“重磅炸弹”——美图公司,这个我们熟悉的影像巨头,终于祭出了它在AIGC领域的大杀器:美图RoboNeo。
一时间,“一句话P图”、“AI商业精修”、“自动做视频”的神仙操作,在设计圈和社媒上刷足了存在感,搞得我们这些做内容的、搞设计的,都忍不住要惊呼:“这也太强了吧!”
但这也让我心里忍不住犯起了嘀咕:这到底是虚张声势搞宣传,还是真有这么能打的实力?
要知道,在AI设计智能体这个赛道上,早有像Lovart这样的先行者凭借其天马行空的创意和独特美学占据了一席之地。那么,作为“AIGC第一股”的美图,姗姗来迟的RoboNeo能否后来居上,成为“更懂中国设计师”的AI伙伴呢?
今天,我将带大家深入实测,把美图RoboNeo和它在这个领域的老对手Lovart拉出来遛遛,通过一系列实战对比,剖析RoboNeo的真实表现,看看它究竟是名副其实的效率神器,还是徒有其表的“纸老虎”。
通用型大模型,咱们这些AI老玩家可是见得太多了。但要说垂直领域的AI Agent,美图RoboNeo一经亮相,就直接吸引了我的目光!大家肯定都好奇:这个RoboNeo,到底藏着哪些“黑科技”,能让我们眼前一亮呢?
要我说,它最大的亮点,就是便捷!RoboNeo的 “一句话修图” 彻底摆脱了传统修图的繁琐操作。你只需用大白话跟它说,比如“帮我消除路人甲”或者“帮我换一身穿搭”,它就能立马心领神会,帮你完成操作。
而RoboNeo的能耐可不只是修图这么简单,它在设计方面也有两把刷子:比如制作封面图和海报。
它不仅有跟Lovart类似的创作界面,支持左右分屏,你可以一边看参考图,一边在自由画布上创作,还能轻松进行图层编辑和素材上传。
更让我佩服的是,RoboNeo背后的AI还自带审美判断力。当你上传参考图片时,它不只是简单地复制,而是能“读图”分析图像的线条、色彩、造型和风格等特点,并将其应用到新的创作中。
▲ 图源网络
更值得称赞的是,RoboNeo目前对所有用户免费开放,无需邀请码,无论是网页版还是APP,数据都能同步,随时随地都能开启你的创作。
经过我的实测,RoboNeo完成一个简单指令大约只需20秒,这效率,对于咱们日常快速出图、想抓住热点的创作者来说,简直不要太香!
光说不练假把式,AI工具的真正实力,还得看实际应用效果。我挑选了几个典型的设计场景,让美图RoboNeo与Lovart同台竞技,看看它们在面对真实需求时,各自的“看家本领”到底如何。
两个平台的链接我放在下面了:
美图RoboNeo:
https://www.roboneo.com/home
Lovart:
https://www.lovart.ai/home
这个功能在短视频时代可以说非常实用,比如最近周杰伦抖音账号爆火的那条AI短视频,就是用了这样的功能实现的。
我也找到了周杰伦小时候的那两张照片,并在美图RoboNeo和Lovart中给出了同样的提示词:
▲ 图源网络
提示词:
“照片中的小男孩笑着跑向自己的钢琴并开始弹奏,弹奏完后抬头朝着镜头笑。要求:视频转场过渡要流畅自然。”
Lovart生成的作品确实是按照我给的参考图生成的,还原度和视频的流畅度没有问题。但只完成了我提示词的后半部分,前半部分”小男孩笑着跑向自己的钢琴“则因为照片的像素过低,被直接篡改了要求,并删掉了。
美图RoboNeo简直太令我失望了,它生成的视频我甚至可以用”毫不相干“四个字来形容。
它几乎完全无视了我给的参考素材,除了小孩的衣服跟照片中一样,视频里的场景、画风、甚至连小孩的样貌都与素材没有任何瓜葛,完全是美图RoboNeo按照我的文字描述,自由发挥生成了一条视频。
而提示里词里描述的“小男孩笑着跑向自己的钢琴”,在视频里呈现的也变了样,小孩的跑更像是在跳舞。
相比之下,在照片生成视频方面,Lovart更胜一筹。
我们在做品牌宣传和产品介绍的时候,最重要的载体,就是H5页面设计。而一个H5页面设计的好不好,恰恰最能直观地检验AI对页面的布局、视觉层次、整体风格,还有那些基础的交互逻辑理解得到不到位!
下面我们就以小米最新发布的智能AI眼镜为例,给出提示词来试试:
“这是小米智能AI眼镜图片,设计出小米智能AI眼镜的产品介绍H5页面,要有首页、产品介绍、客户案例、联系我们这四个页面,要求:连贯性强、信息层级清晰、风格统一。”
网页深色为主、蓝色点缀的设计突出了科技感和现代感,首页展示了产品主视觉,产品介绍页面详细展示了功能和技术亮点,无论是在布局、视觉效果,还是风格统一性上的表现都非常优秀。
但从页上的信息来看,无论是Lovart还是美图RoboNeo,H5页面上的数据均不属实。
而且,美图RoboNeo目前仅支持最多上传两张参考图,所以,如果想让AI生成的H5界面可以直接拿来使用,还需要我们在提供prompt时,将所有信息的内容也一并提供。
在图像和设计领域,海报设计是最常做的工作,而一张海报要做到的不仅仅是美感,更重要的是精准传达信息。
这次,我们让这两大AI agent设计一张青岛啤酒节的海报试试:
我们给出一个相对比较复杂的提示词:
“设计一张青岛啤酒节的海报。主标题“青岛与世界干杯”需要是醒目、有张力的手写风格字体,占据海报上半部分核心位置。海报下方包含具体信息:日期、地点、开幕式主要嘉宾。背景是充满活力的抽象色彩漩涡(蓝、紫、橙渐变),隐约融入一些啤酒元素。要求文字信息排版清晰有层次,主标题与背景融合但不被淹没,整体充满动感和能量。”
Lovart生成了四张海报。
美图RoboNeo生成了两张海报。
可以看得出,两款产品在海报设计上的实力不相上下,他们在在排版设计、背景与文字融合、颜色搭配等方面做的都还算不错,色彩过渡也很流畅。
但两款产品生成的海报,也都存在一些瑕疵,几乎所有的海报都存在着同样的问题——海报底部的小字出现了错字和乱码。
一番实测下来,相信大家已经对这两款工具有了一定的了解,而还有一个大家比较关心的问题,就是是否收费。
美图RoboNeo目前来说是完全免费使用的,但Lovart则要消耗一定的积分,积分每日赠送300,足够做一些简单的设计消耗了。
今天就分享到这吧,最后我用三句话总结一下:
1、美图RoboNeo作为美图在AI Agent领域的最新尝试,其“一句话修图”的便捷性和强大设计能力,加之免费使用的策略,无疑为普通用户和设计师带来了福音。
2、但在实际测试中,美图RoboNeo在照片生成视频的素材还原度和复杂创意视频的连贯性方面仍有不足,但在H5页面设计上表现出色。
3、至于老对手Lovart,虽然在某些设计细节上处理得更系统、更有美感,但处理照片生成视频时对原始素材的执行力较弱,且在免费使用上不如RoboNeo彻底。
文章来自于“我的Ai笔记”,作者“周家栋”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】MoneyPrinterTurbo是一个可以让用户通过关键词和文案就可以生成高清短视频的项目。
项目地址:https://github.com/harry0703/MoneyPrinterTurbo
在线使用:https://reccloud.cn(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0