就在最近,豆包上新了图像创作模型 Doubao-Seedream-4.5(以下简称 Seedream 4.5)。
猜猜下面两张图片,哪张是 Seedream 4.5 生成的?哪张是最近风头正盛的 Nano Banana Pro 生成的?


答案是:上边是 Seedream 4.5 生成的。你猜对了吗?
为了进一步测试它的底子,我们接着和 Nano Banana Pro 搞了几场「PK」。
同样的提示词:
一位时尚的年轻亚裔女性在准备外出赴约时,用闪光灯拍摄了一张极具魅力的镜前自拍照。


上边是 Seedream 4.5,下边是 Nano Banana Pro。
Seedream 4.5 精准捕捉到了亚裔女性的特征,甚至在没有限制尺寸的情况下,自动生成了更符合自拍逻辑的竖画幅。
第一眼看到这张图,我以为是哪位颜值博主在某书发的自拍。
相比之下, Nano Banana Pro 显得没有那么了解当下亚洲女孩的审美。
接下来看看一致性,我将刚刚 Seedream 4.5 生成的亚裔女孩喂给了它们俩,让它们生成一组《时尚芭莎》风格的照片。


几个问题:能看出是刚才的女孩去拍大片了吗?你发现上图是 Seedream 4.5 生成的了吗?你是如何分辨出来的?
话不多说,接下来带大家深扒一下,这个新模型大家都在怎么玩。
姐妹,神图有了
找人帮忙拍照虽然「解放双手」,但成片质量全看天意。 数次被拍成「大猩猩」后,我的结论是:抱着「必出神图」决心的,只有我自己。(爱你,老己 🤟)
但这次……Seedream 4.5 好像真的值得「托付」。
还是刚才的亚裔女孩,使用 Seedream 4.5 达成了夸张的广角畸变,让前景的手部看起来巨大,但手指的关节结构、脸部的神态依然保持得非常清晰锐利,完全没有崩坏。那种电影海报般的「故事感」扑面而来。

提示词:一张16:9的图片,描绘了一个充满张力的战斗场景。画面采用超广角镜头和戏剧性的荷兰式倾斜构图(Dutch angle)。主体姿态大胆动感,身体随镜头倾斜带有惯性。关键细节: 她的右手在脸前比出「手枪」手势(食指伸直,拇指竖起),目光锐利地跟随指尖指向前方;左手置于右手下方略靠前,五指完全张开掌心向上。由于广角镜头的极端透视畸变,前景的左手显得非常巨大,极具视觉冲击力。光影与画质: 尽管透视夸张,但双手和脸部细节必须清晰锐利,解剖结构准确,线条干净。光线为柔和的室内照明,背景是中性模糊的环境,突显出动作的紧张感。
不用反复摆姿势,AI 一次就能给你满意的结果。我的新结论是:
求人不如求己,求己不如求 Seedream 4.5。
AI 也懂你的搭配小巧思
以往 AI 很难处理好汉字,但这张图里,无论是「美疯了」还是「长发配礼帽绝了啊啊啊」,中文字迹很自然,有点像是用记号笔直接在照片上涂鸦一样。甚至能根据人物的穿搭自动生成夸赞的文案。

提示词:在现有的图像基础之上,直接覆盖添加一层凌乱的的评论、极富表现力的涂鸦,以及充满活力的编辑风格笔记。整体效果必须看起来像是用记号笔直接在打印出来的照片上书写的一样。字迹需要表现出一种自发、未经过滤、情感化、略显混乱且非常私人的感觉。所有添加的文字必须满足以下条件:语言必须全部为中文;看起来像是手绘的、不均匀的、随意的,并且相互重叠;语气必须是积极向上的。每一条手内容都不是预设的,系统必须自动分析所上传图像的视觉内容,并根据可见的元素来赞美画面中的人物。主要观察人物服装风格、面部表情、情绪氛围、身体姿势、配饰细节或色彩搭配等。这些评论必须是针对照片中突出的视觉吸引力或令人钦佩之处进行定制的独特赞美,严禁使用重复或通用的客套话。在文字之外,还需要添加以下剪贴簿风格的元素:指向值得注意的时尚细节的箭、在有趣的区域下方画上强调的下划线、圈出画面中的特定元素、像编辑修改痕迹一样被划掉的笔记。
但是效果并不稳定,需要耐心调试。
打破次元壁
直接上图,帅到谁了我不说。


提示词@TechieBySA:角色的分割肖像,左侧为风格化的二维卡通或漫画风格,右侧为超写实的电影肖像风格。两部分在中心完美对齐,中间以撕开的漫画纸边缘分隔,象征着从插画到现实的过渡。卡通部分采用扁平化的简洁图形,而写实部分则展现出丰富的纹理细节。柔和的中性摄影棚背景,戏剧性的光线,平衡对称的构图,1080x1080 正方形画幅。
图中同时呈现出了两种画风。左边是二维卡通漫画风格,右边是超写实风格,中间用「撕开的漫画纸边缘」作为分割线,实现了无缝对齐,非常适合做个性头像或概念海报。
说实话,能够在一个 Prompt 里同时调度两种完全不同的渲染逻辑,且构图依然保持平衡对称,非常考验也展示了模型的指令遵循能力。
大道具,小人物
巨物题材最怕「假」,但看下面两张图,Seedream 4.5 对物理重量的理解还是让人惊喜的。
一个普通身材的角色与一个体积巨大的物体进行互动,通过夸张的比例差制造视觉奇观,但 AI 依然能处理好身体的受力姿态,不会出现违和的「悬浮感」。
那还说啥了,提示词也放后面了。

主体与视角: 一张图片主体的全身超逼真摄影棚人像,采用低角度仰视视角。角色以充满力量感的运动姿态被捕捉,正在与一个巨大的超大尺寸篮球进行互动。互动描述: 表现为单手将其托举在背部,画面展现出肉眼可见的身体张力。物体细节: 一个细节丰富的超大篮球,材质为带有颗粒感的橙色皮革配金色线条。它占据了画面的角色身高的80%。背景: 无缝的浅灰色墙壁和搭配的地板。氛围与风格: 极简奢华运动风。8K超精细渲染,构图精准,完美比例,自然的物理接触,纹理清晰,反射准确,色调平衡。

主体与视角:一张衣着专业、身上沾满面粉尘埃的年轻女性甜点师的全身超逼真摄影棚人像,采用富有冲击力的低角度仰视视角。角色以充满爆发力的运动感杂志大片姿态被捕捉,正在与一个巨大的超大尺寸金属线状打蛋器进行互动。互动描述: 表现为双脚分开站稳,身体大幅度前倾,用全身的重量和核心力量压住并试图转动那个巨大的打蛋器,仿佛在搅拌一缸粘稠的原料,画面展现出肉眼可见的手臂肌肉线条紧绷、自然的吃力感和瞬间冻结的动态能量。角色和物体在画面中完全可见,比例缩放得当,呈现出一种既超现实又具真实感的视觉平衡。物体细节: 一个细节丰富的超大钢丝打蛋器,材质为高度抛光的食品级不锈钢,金属线圈上粘着少许逼真的、半透明的蛋白霜或面糊残留物。它占据了画面的角色身高的130%(巨大的头部倾斜着占据前景)。表面具有逼真的冷金属光反射、钢丝交织的复杂纹理细节,以及角色双手紧握手柄时指关节发白的精确物理接触感。灯光与环境: 柔和的专业摄影棚布光,具有平衡的高光和漫射阴影,清晰的反射和柔和的光线衰减,以强调真实感。背景: 无缝的柔和奶油色墙壁和搭配的地板,极简、干净、带有微弱反光,与面粉和金属的色调相得益彰,保持画面干净。氛围与风格: 充满活力的烹饪动作大片,强调材质触感与动态张力。8K超精细超逼真摄影棚渲染,构图精准,完美比例,自然的物理接触,纹理清晰,反射准确,色调平衡。
这才是自带 BGM
今年不想截图官方平台的年度听歌报告?这里有一种既能展现喜爱歌手的美貌,又能秀一把自己听歌品味的方式。
巨大的竖屏手机不仅没有产生割裂感,反而通过对屏幕透明度的精细处理,让界面的微光与人物身上的影棚柔光完美融合。


提示词@TechieBySA:一幅歌手的逼真全身肖像,采用其标志性风格,旁边是一部巨大的竖屏智能手机,屏幕上显示音乐播放器界面播放歌曲,并采用()强调色,透明度约为 80%,以营造高级美感。艺人身着标志性的服装,摆出自信而富有时尚感的姿势,完美诠释了歌曲的情绪和能量。她的表情与她的形象相得益彰。纯色背景,带有柔和的灯光点缀• 采用柔和的影棚灯光,搭配()调彩色滤光片;35mm 或 50mm 镜头,f/2.2 光圈,ISO 100-160,快门速度 1/125 秒;清晰聚焦于主体和手机界面• 编辑风格与高端音乐平台推广活动保持一致。
总的来说,你不再需要精通复杂的修图软件或排版理论,只需要一个好的脑洞,就能让 AI 像一个懂审美、懂排版的设计搭档一样,精准还原你脑海中的画面。
还没试过的朋友,赶紧去豆包试试看!
文章来自于微信公众号 “APPSO”,作者 “APPSO”
【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。
项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file
在线使用:https://aicomicfactory.app/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0