大家好,我是袋鼠帝。
预告了很久,Google终于把他们蓄势已久的NanoBanana2给放出来了。
它的官方名字其实叫NanoBanana Pro。
这是Google专为解决最具挑战性的图像生成任务而设计的,融合了最先进的推理能力。简单说,它是一个会思考的生图模型,在生图之前,它会先在脑子里推理一番,所以画出来的东西,逻辑性极强,细节更精准。
昨晚,我在群里预告了一下,NanoBanana 2(也就是Pro版)已经开放API了,但只有在一些第三方平台能用上。
有群友就已经开始催Lovart上线了

我昨晚也是一直在等Lovart上线NanoBanana2
等到23:10分左右,终于来了

在lovart.ai上,叫NanoBanana Pro。
说实话,NanoBanana Pro是真滴强,昨晚大家也是玩嗨了,各种群里,听取卧槽、牛逼声一片


我也好久没这种兴奋感了,从昨晚一直玩到凌晨4点,在Lovart上用NanoBanana Pro跑了好多图。
测完之后,我只想说四个字:太牛逼了。
而且,不出我所料,Lovart又带来了福利。
这次是NanoBanana Pro全员限时免费3天。
到23号,在Lovart上用这个最强模型生图,不要钱,不扣积分,随便造。
这羊毛,不薅白不薅。

先来试试Lovart最新功能「Edit Element」:图层分离+改字
它能自动识别一张图片中的不同元素,把它们拆分成独立图层。甚至,可以识别并直接编辑文字!
我先生成了一个数字名片
Prompt:生成一张逼真的照片,展示一只手拿着一张透明的未来感玻璃卡片,卡片上显示的是我的社交媒体个人资料界面。卡片在粉红、紫色和蓝色的渐变霓虹灯光下发光。背景是深色且模糊的,以突出发光的边缘。玻璃卡片上显示着卡通风格的个人照片、认证徽章、用户名、昵称、年龄、项目信息、网站、加入日期和粉丝统计。手指上的灯光反射看起来电影感十足且充满情绪,给人一种高科技全息的感觉。超逼真,8K 细节,景深,赛博美学。
然后用编辑元素功能,手动调整数字名片的信息


这个功能非常方便,能快速,稳定的调整内容
我女朋友喜欢养绿植,她去小红书找了10种不同的绿植图片,丢给了Lovart,让它一次性生成这10种植物的介绍卡片,而原始的10张图片只有绿植名称,其他信息都是Agent自己补充的,且完全准确!不管是Agent能力还是指令遵循都非常强。

不知道大家有没有看过《孤独的美食家》,我在B站上看的时候就被他们B站官方制作的那种菜单翻译惊艳到了。
但是在AI面前那个效果就是个弟弟
Prompt:给这个菜单旁边标注中文,中文要跟其他文字字体一样,看上去没有违和感


卧槽!!这太🐂🍺了,真滴毫无违和感,而且只需要10多秒搞定,应用场景太广了
看到菜单,我就想到了吃
Prompt:创建一个信息表,以手绘插画的形式展示如何制作番茄牛腩

Lovart Agent不愧是设计类Agent,比单纯用NanoBanana Pro模型的效果好多了。
上图是Lovart Agent+NanoBanana Pro生成,下图是只用NanoBanana Pro生成

Prompt:制作一幅插图说明图,详细解释图中所展示的流体动力学原理以及接下来会发生什么。


Prompt:如果在水中加入大量盐,鸡蛋会发生什么变化


不仅中文能力提升很大,物理学也超强,而且在Lovart生成的图片一般都是几M,图片细节非常好。
既然它能标注动力学原理,那么,有没有可能,我以后写教程,也不用自己手动标注了呢?
Prompt:我想写个教程,请你帮我在图片中模拟截图之后使用微信编辑工具进行标注(红框+红色箭头+红色文字),标注出创建知识库、新建应用、新建插件的位置,并简单讲解


牛的!
你可能觉得这个还不如自己截图操作,但是如果接入自动化工作流呢,这个想想空间太大了!
特殊电影美学风格+中文特殊字体生成
感谢@kiki大佬提供的帮助,电影级质感太棒了
Prompt:帮我生成一张图:对称构图,居中拍摄,古怪的粉彩粉色酒店大堂,穿着紫色制服的门童静止站立,他手里拿着一把伞,伞上面写着毛笔书法字体“文艺复兴”,字体完美的贴合在雨伞的材质上,复古家具,平光,粉彩配色,异想天开的氛围,韦斯·安德森风格,35mm胶片颗粒。横版16:9比例

Prompt:请帮我把上图中的人物替换成一个星球大战中的绝地武士,他手里拿着一把光剑,做出一个漂亮的攻击姿态。

稳得很,画质同样非常高~
高质感真实风格影像人物生成
Prompt:老年渔夫特写肖像,饱经风霜的脸,深皱纹,皮肤纹理细节,眺望远方,自然阳光,海洋背景虚化,原始照片风格,富士胶片拍摄,逼真的眼睛,高细节,85mm镜头。

Prompt:把上图人物的视角改成纯正面、向下45度俯视拍摄角度,把景别改为中景。

这质感,这人物一致性太顶了。
而且这清晰度,真的只有Lovart了,几M的图片传上来,一度把公众号编辑器都搞卡顿了。。
二维吉卜力美学风格
Prompt:动漫风格,吉卜力工作室美学,俯瞰蓝色海洋的草坡,巨大的积云,骑自行车的女孩,鲜艳的绿色和蓝色,手绘背景纹理,柔和阴影,宁静氛围,高质量2D动画。

Prompt:请把远处的大片白云去掉,然后增加几个白色的海鸥飞翔在海面上。增加白色主题文字“薄荷假期”,字体用倾斜的手写体,清爽感和文字感

Prompt:帮我生成一张超现实主义风格的奇幻电影海报,电影名称是“傻瓜阿望的奇妙旅途”,电影的主角的一个身穿蓝色校服的小孩,参考国内外优秀电影海报的审美和创意来进行设计,主体文字字体偏可爱神秘,可以加入一些英文来辅助设计排版,画面比例为横版16:9

Prompt:广角镜头,废土末日荒原,埋在沙子里的生锈汽车,远处的废墟摩天大楼,背着背包的孤独流浪者,沙尘暴逼近,低饱和度,疯狂的麦克斯狂暴之路风格,史诗般的电影构图。

这一套下来,我发现Lovart非常适合做电影级的视频分镜,特别是可以在无限画布上面批量处理,而且画质贼高。
中文科普
Prompt:给我展示一个太阳系图表,并用中文给每个行星标注一个有趣的事实

看个好玩的~
Prompt:一幅充满讽刺和超现实主义的中国工笔重彩画杰作,题为《硅谷夜宴图》。它模仿《韩熙载夜宴图》的构图,但主角是身着宋代贵族服饰的现代科技巨头。
**构图与人物 (现代阵容):**场景是豪华的宋代宴会厅。1. **唐纳德·特朗普 (Donald Trump):** 坐在主榻上,身穿**奢华宽松的金黄色丝绸长袍**。他正处于演讲状态,做着标志性的**手风琴手势**,看起来喧闹且自信。他标志性的金发被梳成了一个凌乱的古代发髻。
2. **埃隆·马斯克 (Elon Musk):** 坐在特朗普对面,手持玉酒杯。他身穿**深蓝色的文人长袍**。他看起来若有所思,盯着一只笼中鸟(暗指推特)或一个机械木制玩具。3. **马克·扎克伯格 (Mark Zuckerberg):** 坐得稍微分开些,姿势僵硬笔直。他穿着**浅灰色的长袍**。他的表情是著名的空白和机器人般的凝视,正专注地盯着一卷书轴。他的脸非常苍白(像涂了厚厚的脂粉)。**视觉风格与融合:**
- **面部:** 面孔是马斯克、特朗普和扎克伯格清晰可辨的漫画式肖像,但用**中国传统的毛笔笔触**(墨线勾勒,矿物颜料晕染)渲染。他们完美地融入了古画风格中。
- **环境:** 周围环绕着吹奏笛子和斟酒的宋代仕女。
- **细节:** 古代家具、蜡烛和屏风。
**字体与印章:**
- **题跋:** 左侧的竖排书法描述了这一场景。
- **印章:** 角落盖有红色的收藏印。
**美学:**
写实与古画的无缝融合。质感是带有裂纹和褪色的陈旧绢本(仿古效果)。**负面提示词:**现代西装, 照片级摄影, 西方绘画风格, 扭曲的脸, 无法辨认的角色, 现代科技产品 (手机/电脑), 杂乱的绘画。

用来做科普真的太棒了(病毒传播的科普插画)
Prompt:高质量的平面摄影作品,创建一个简单的 DIY 病毒性感冒图表长图,排列在干净、浅灰色纹理的背景上。视觉故事从左到右以清晰的步骤流动:内容基于这个:长图内容包含:定义、症状、传播途径、高危人群、不能做的事、正确恢复方式、何时就医、预防措施。简单的黑色箭头手绘在背景上,引导观众的视线从病毒到接触源。整体氛围是教育性的、现代的、易于理解的。图像采用俯视、鸟瞰视角拍摄,柔和均匀的光线最小化阴影,使焦点集中在过程上。

感谢变现群,群友@shaoming的Prompt
Prompt:生成-张16:9比例的王家卫 重庆森林电影 的复古港风电影海报图片

感谢变现群,群友@朱斌的Prompt
Prompt:best quality, masterpiece, ultra detailed, 8K, panoramic triptych (三栏全景), seamless transition (平滑过渡), medical history evolution (医疗史演变), ancient to future (古代到未来) 二、分模块细节提示 1. 左侧(古代智慧:草本与针灸) - 风格: traditional Chinese ink wash illustration (中国传统水墨插画), warm sepia tones (暖棕色调), ancient architecture (古建筑:宫殿、庭院) - 元素: ancient Chinese doctors (古代郎中) in hanfu (汉服), herbal medicine (草药) on wooden table, acupuncture (针灸) treatment, patients lying on beds, scribes recording prescriptions ( scribes记录药方), traditional pottery (传统陶罐) - 氛围: serene, traditional wisdom (宁静、传统智慧) 2. 中间(现代实践:科技与标准) - 风格: photorealistic (写实风格), modern urban background (现代城市背景:高楼、救护车) - 元素: paramedics (急救人员) in uniforms, stretcher with patient, defibrillator (除颤器), ambulance, professional medical equipment (专业医疗设备), blue/white cold tones (蓝白色冷色调) - 氛围: urgent but orderly (紧急但有序), technological efficiency (科技效率) 3. 右侧(未来展望:智能与互联) - 风格: cyberpunk futuristic (赛博朋克未来风), holographic interface (全息界面), neon blue light (霓虹蓝光) - 元素: VR medical training (VR医疗培训), drone delivery of medicine (无人机送药), personalized health data (个性化健康数据), 3D human body hologram (3D人体全息), smart feedback mannequin (智能反馈人体模型) - 氛围: innovative, interconnected (创新、互联) 三、过渡与整体协调 glowing light streams (发光光带) connecting three sections, cohesive color gradient (统一的色彩渐变:暖→冷→蓝), dynamic composition (动态构图)
一个从古代到现代,乃至未来的医疗进化,一场穿越时空的医疗守护之旅

上面这张图从Lovart的Agent生成,下载下来有23M,你敢信。
另外,在11.30号前订阅Basic以上任意Plan,Lovart直接送Nano Banana Pro「365 天 Unlimited」(这个模型还挺贵的……)0积分不限量使用,会员有效期内整整一年顶配模型随便造(Nano Banana Pro+Nano Banana+即梦4+MJ v7)

用Lovart生成了一张孟菲斯风格的活动宣传海报,Agent里面还可以选择我喜欢的灵感参考图,这个环节我太爱了。
昨晚在群里,有朋友问我:既然Google都开放NanoBanana Pro了,我们为什么不直接去Google那边用模型,要通过Lovart这个平台呢?

我觉得,这就好比,给你一台顶级的法拉利发动机(模型),你是想把它放在自家车库里积灰,还是想把它装进一辆专业的赛车里,去尽情驰骋?
虽然上面比喻可能并不是那么恰当,但是我想表达Lovart做的,就是工程化赋能模型能力。
实测下来Google的NanoBanana Pro,确实是目前地表最强的生图模型,风格稳,人脸稳,多语言能力强。
如果在配合上Lovart的Agent交互,无边画布的自由构图,图层分离的精细编辑,以及Touch Edit的指哪改哪,NanoBanana Pro的潜力,能被进一步释放出来,变成我们更加得心应手的生产力工具。
这种强强联合(工程化能力+顶级模型),是我们普通创作者最需要的。
能看到这里的都是凤毛麟角的存在!
文章来自于“袋鼠帝AI客栈”,作者 “袋鼠帝”。
【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。
项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file
在线使用:https://aicomicfactory.app/
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0