顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

13842点击 2025-09-09 17:38

刚刚，火山引擎上线了豆包・图像创作模型 Seedream 4.0，我提前试了一下，应该各位也看到了各种非常强的玩法和图片。

简单来说就是一个支持图片生成、连续图片编辑、多图参考的全能图像创作模型。

藏师傅玩了两天跑了上千张图片之后基本摸清了这个图像创作模型的能力，优秀的美学表现、世界知识、提示词遵循、一致性保持、精准的编辑能力、完美的中文支持，而且还能自定义生成比例，还有直出 4K 图片的能力，对于中文用户来说毫无疑问这就是当前 T0 级别的图像创作模型。

当然我也发掘的非常多有意思的玩法，前几天发了几个以后已经有人开始自己接单或者做产品开始盈利了。

现在开始，企业客户就可以通过火山引擎MaaS平台火山方舟接入Seedream 4.0，而且这是所有渠道中唯一支持 4K 图片直出的 Seedream 4.0 图像创作模型。

个人用户也别着急，Seedream 4.0已同步在豆包、即梦APP全量上线。4K直出的版本，将于今晚20:00首次开放给个人用户，搜索“火山方舟体验中心”，就能第一时间体验。

开始我们的教程，如果你暂时没时间看的话，也可以点赞或者转发收藏一下，谢谢了🙏

先来看一下玩法目录：

可以用提示词控制你能想到的任何修图细节和术语，一人创建美颜相机的时候到了

一键为你的偶像或者喜欢的角色生成连续的视频分镜

将你的任何照片变为玻璃质感的头像或者图标

将你的宠物照片变成山海经神兽护身符壁纸

定制自己的玄学鼠标垫

为你自己和偶像定制超好看的创意头像

无痛 Cos 你喜欢的动漫或者游戏角色

修改任意 UI 设计稿或者海报变成你需要的内容

自媒体神器-基于任何内容创建多种风格的知识卡片

真正的AI修图

首先是一个体现Seedream 4.0 修改精细度的案例，也是现在独家的能力，他能对我们日常修图美颜涉及到的所有关键词做出响应。

不管是光影、滤镜、装造还是发型，基本上你能想到的名词他都知道，而且这些元素还可以在提示词中随意组合。

光影的效果是最好的，除了我们常见的光线外我还测试了分割光、环形光以及伦勃朗光这种非常复杂的打光方式， Seedream 4.0 也都能响应，而且提示词极其简单。

提示词：将画面光影改为 XXX

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

我们常见的滤镜照片滤镜也没问题，这里你甚至可以不止给人像加，加在风景图上也是可以的，而且不会影响原有照片的内容。

提示词：为画面添加 XXX 滤镜

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

说实话复杂装造这个我没想到他可以搞定的，因为化妆这个事情实在是太过于细微了，结果大部分的装造关键词他都能响应，找女性朋友看了一下她已经相当满意了，眼线这种过于细节响应有时会有点问题。

提示词：为角色添加 XXXX 装造

氛围感韩系妆 + 奶油肌底妆 + 毛流感雾眉 + 大地色消肿眼妆 + 太阳花睫毛 + 奶茶色氛围感腮红 + 水光镜面唇釉。

Y2K甜酷风 + 柔焦雾面底妆 + 上扬野生眉 + 粉紫色系小烟熏 + 上扬猫眼线 + 立体修容 + 丝绒哑光红唇。

白开水伪素颜妆 + 清透光泽肌 + 根根分明的野生眉 + 杏色哑光眼影 + 自然卷翘睫毛 + 元气杏色腮红 + 裸色水光唇。

日杂氛围感 + 清透奶油肌底妆 + 原生感雾眉 + 低饱和蜜桃色系眼妆 + 卧蚕提亮 + 棕色内眼线 + 大面积氛围感腮红 + 玻璃感嘟嘟唇。

新中式典雅风 + 半哑光玉瓷肌底妆 + 古典远山眉 + 哑光大地色消肿眼妆 + 极细上扬眼线 + 根根分明长睫毛 + 哑光收缩色修容 + 复古红丝绒唇。

温暖复古风 + 柔焦雾面底妆 + 毛流感野生眉 + 赤茶/枫叶色系眼妆 + 酒红色眼线 + 浓密卷翘睫毛 + 杏仁奶茶色腮红 + 土橘色/巧克力色哑光唇。

精致吸睛晚宴妆 + 高遮瑕丝绒底妆 + 欧美风利落挑眉 + 灰紫色系小烟熏 + 香槟金闪片提亮眼中 + 浓密簇状假睫毛 + 立体骨相修容 + 饱满浆果色哑光唇。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

发型这里的话基本上常见的发型都能响应，但是一旦涉及到某个发型加点层次这样的就不行了，因为改变太细微了，有点强模所难。

提示词：将图中人物发型更改为 XXX

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

这玩意让现在做美颜相机这种应用门槛非常低了，你完全可以探索出一个图表结合 LLM 解析用户的修图需求做出一个言出法随的美颜应用，而且可以跟用户原来的人脸保持高度的一致性。

一键为你喜欢的角色生成小剧场视频

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

当时大家都为 Nano Banana 那种基于几个角色然后连续出分镜图的案例惊叹不已，结果自己试了一下发现，三张图就无法保持 ID 了，而且清晰度过低根本没办法看清脸，不可用。

Seedream 4.0 这次可用程度相当高，生成的图片因为非常清晰对于人脸的表现也很清晰，在连续生成 6 张图之后人脸 ID 还能保持得很好。

如果你只需要参考角色面部的话建议上传大头照，这样效果最好，如果需要参考服装的话就上传全身或者半身照。

我这里让模型虚构了一个凡人修仙传的韩立和紫灵穿越到巴黎谈恋爱的小剧场，说清楚需要场景以及要几张图就行，当然你也可以自定义每个场景的画面提示词，不过我觉得让模型发挥效果更好。

图片提示词：

参考这两个角色的面部和发型，将其更改为现代冬天的装束，生成 6 张连续的在巴黎约会的分镜图，写实电影剧照风格，需要在一个场景中，连续动作

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

再生成完图片之后你可以用 Seedance （个人用户在即梦app、企业用户在火山引擎上可以使用）的首尾帧视频模型或者智能多帧模型用我这套提示词为每两张图之间生成首尾帧的提示词。

首尾帧视频提示词生成：

你是一位顶尖的创意视频导演和VFX（视觉特效）概念艺术家。你的任务是为AI视频生成模型设计一个从【起始帧】到【结束帧】的转场过程。

你的核心目标是：构思并用一段话清晰、具体地描述这个动态视觉变化。

在构思时，请遵循以下创作框架：

第一步：分析差异快速判断【起始帧】和【结束帧】的差异程度。

A类 - 关联性强：主体或场景基本一致，只是状态、风格或环境发生改变（例如，同一个人换了衣服，同一个场景从白天到黑夜）。

B类 - 差异巨大：主体和场景完全不同（例如，一只猫在客厅 → 一艘飞船在太空）。

第二步：选择转场策略

如果属于 A类，优先采用“原地演变”的策略。让变化直接发生在主体和环境上，尽量不使用或只使用微弱的摄像机移动。

如果属于 B类，采用“运镜驱动转场”的策略。必须使用一种明确的摄像机移动（如推、拉、摇、移、旋转）来引导过渡，让镜头运动成为连接两个不相干画面的桥梁。

第三步：构思具体变化（从以下工具箱中选择组合）

主体变化：主体如何改变？（形态变化、材质替换、服装更替、分解重组、消失或出现）。

环境变化：背景如何改变？（时间流逝、季节更替、空间切换、从现实变为幻想）。

风格/特效变化：用什么视觉风格或特效来包装这个过程？（例如，画面逐渐像素化后重组、被火焰/水流吞噬后显现、转变为水彩/油画风格、出现光效粒子）。

输出规则：

将你的最终构思整合为一个连贯的段落。

描述要具体、直接，充满画面感。专注于“我们看到了什么”，而不是“我们感觉到了什么”。

严格遵守你在第二步中选择的摄像机移动策略。

避免使用模糊的比喻和过于文学化的修辞。

现在，请根据我提供的【起始帧】（图片A）和【结束帧】（图片B），生成你的转场描述。

生成多个视频后只需要把视频按顺序用剪映或者其他工具剪辑加上配乐就行，最近我已经看到过好多个类似的的视频爆火了，也可以直接把这个流程自动化做成产品或者工作流，感觉应该很赚。

转换任何大纲变为精致PPT页面

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

这个才是这次的大活之一，以往的 AI PPT 产品要么是套模版素材，无法自定义而且模版往往不适合你的大纲，要不就是用前端代码写，写出来的页面很多时候只有图标和文案非常单调。

看到 Seedream 4.0 的时候我就知道机会来了，我搞了一套流程可以直接提取你的PPT要点变成非常有质感的思维模型演示PPT页面。

而且生成的图像非常实用，图片左边或者右边会留下为你写字排版的空间，生成的图片符合你的思维模型，比如并列的就会展示玻璃卡片，递进的就会是金字塔，完美兼顾了美观、可控和表意。

使用方式就是将下面这个提示词跟你这一页的文案内容一起发给豆包之类的多模态模型，他就会为你生成对应的 Seedream 4.0 图片提示词，然后直接输入调整比例就能获得 PPT 背景图了。

生成提示词的提示词：

角色： 你现在是一位顶级的视觉概念设计师，专注于将商业或学术PPT内容转化为富有现代感、空间感和高级质感的视觉图像概念。你的设计既要美学出众，又要精准传达内容的内在逻辑。

核心任务： 你的任务是接收用

一张电影海报级别的视觉作品，采用极简主义和空间主义风格。三块大小不一、轮廓分明的长方形磨砂玻璃板，以一种优雅的姿态悬浮在画面的右半部分。最大的玻璃板靠后，上面以简洁无衬线的白色字体蚀刻着核心公式 “变量 = 突破点”；前面两块较小的玻璃板前后错落，分别蚀刻着 “新用户 = 突破点 - 惯性” 和 “突破点 = 时代变量”。

玻璃材质具有高级的半透明磨砂质感，边缘锐利，能捕捉光线。一束强烈而聚焦的聚光灯从画面左上方斜射而下，穿透玻璃，在其表面形成柔和的光晕和清晰的轮廓光，并在深色背景上投下富有层次感的柔和长阴影。

背景是纯粹的、带有微弱颗粒感的哑光深灰色墙面，营造出静谧而深邃的空间感。整体色调冷静，光线中带有极微弱的青色，赋予画面科技感和智慧感。

构图上，所有视觉主体严格集中在画面的右侧，为左侧留出大片干净的背景区域，以实现黄金分割和不对称的美感，方便后期排版添加详细文字。

户输入的PPT文本内容（通常包含一个标题和几个要点），并基于这些内容创作一段用于AI绘画的、详细的、电影海报级别的图片生成提示词（Image Generation Prompt）。

最终输出的图片提示词必须遵循以下风格和规则：

a.核心视觉材质（二选一）：

你必须根据内容的调性，在以下两种核心材质中选择一种作为视觉主体：

A) 磨砂玻璃 (Frosted Glass): 具有半透明的磨砂质感，边缘轮廓分明（可锋利或圆润）。适合表现温和、优雅、偏人文或策略性的概念，能营造光线穿透的柔和美感。

B) 高质感金属 (High-Texture Metal): 如冷静的铂金、拉丝铝、哑光黑钢或有分量的钛灰色。适合表现科技、力量、专业、流程和稳固的概念，能营造锐利的光影反射和坚实的体量感。

b.结构与布局（思维模型匹配）：

在生成提示词前，你必须首先分析用户输入内容之间的逻辑关系，并选择最匹配的视觉模型进行构图：

【金字塔模型】: 内容具有层级、进阶或基础与上层建筑关系时使用。将要点从下至上分布，体现稳固和递进。

【垂直面板模型】: 内容是几个并列的核心支柱、原则或分类时使用。使用几块高大、纤薄的面板前后错落或并排，体现支撑感和独立性。

【协同环形模型】: 内容是循环、协同、共生或相互关联的联盟关系时使用。使用几个玻璃或金属圆环相互穿插、嵌套，体现动态、协同与密不可分。

【流程闭环模型】: 内容是一个分步骤、有顺序的完整流程时使用。使用几段独立的弧形，在空中即将拼接成一个完整的圆形，但在接口处留有发光的微妙间隙，象征着一个即将完成的、动态的流程。

【悬浮解构模型】: 内容是几个相对分散的要点、特性或组成部分时使用。使用几片大小不一的玻璃或金属板在空中错落有致地悬浮，体现解构、多元与灵活性。

c.文字内容处理：

精炼化： 自动将用户输入的长句要点提炼为2-6个字的短语或关键词。

一体化： 描述文字以简洁、无衬线的白色或浅色字体“镌刻”、“烙印”或“蚀刻”在材质表面，使其看起来与主体融为一体。

d.色彩、光影与背景：

色彩方案： 根据内容和所选材质，搭配合适的色彩。例如，铂金搭配数字蓝，磨砂玻璃搭配莫兰迪色系。

光影效果：必须设定明确且富有戏剧性的光源。可以是“一束锐利的聚光灯”，用以制造轮廓光和清晰的阴影；也可以是“从元素中心或缝隙中溢出的光芒”，用以强调内部能量和动态张力。

背景：背景需要简洁且能衬托主体。可以是纯粹的哑光暗色背景，也可以是与主题相关的带有微肌理的背景（例如，深邃的数字蓝图、微光的网格、带有细微颗粒感的浅灰色墙面）。

e.构图与留白：

核心要求：在构图时，必须将所有视觉主体偏向画面的某一侧（左、右或偏上/下），在相对的另一侧形成大面积的、干净的留白区域。 必须在提示词中明确指出这一点，例如：“所有主体结构集中在画面右侧，为左侧留出大片干净的背景区域，方便后期排版添加详细文字。”

工作流程示例（基于你的新案例）：

a.接收用户输入：

第一步是清晰地定义问题。

第二步是快速地构建解决方案。

第三步是不断进行验证和迭代。

第四步是最终实现项目的闭环。

标题：我们的敏捷开发流程要点：

b.内部思考：

逻辑分析： 这是典型的分四步走的、有顺序的、最终要形成闭环的流程。

选择模型：【流程闭环模型】 是完美匹配。

选择材质： 内容偏向科技和流程，【高质感金属】 中的铂金色非常合适，显得专业、冷静。

文字提炼： “定义问题”、“构建方案”、“验证迭代”、“实现闭环”。

风格选择： 背景使用“数字蓝图”，光效使用“中心发散”，符合科技感主题。

构图规划： 将即将闭合的圆环放在画面右侧，左侧留白。

c.生成最终的图片提示词（输出）：

d.一个巨大的圆环由四段独立的弧形构成，悬浮于画面右侧。它们在空中几乎要拼接成一个完整的圆形，但彼此间留有发光的微妙间隙，象征闭环瞬间的动态张力。四段弧形上依次以蚀刻工艺呈现出'定义问题'、'构建方案'、'验证迭代'、'实现闭环'的字样。整体材质为带有冷静光泽的纯净铂金色，表面光滑且反射着环境光，极具科技感。背景是深邃的、带有微光网格的数字蓝图。一束柔和但聚焦的光线从圆环的中心向外发散，将视线引向那即将闭合的缝隙。画面的整个左半部

可以看一下这几个结果，这里我找的橘子前几天的演讲 PPT 非常符合实际，左边的纯色图片是他原来的，右边的是我用了模型生成的图加上一些文字排版的结果，对比非常明显。

提示词：

构图上，所有视觉主体严格集中在画面的右侧，为左侧留出大片干净的背景区域，以实现黄金分割和不对称的美感，方便后期排版添加详细文字。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

提示词：

构图上，所有视觉主体严格集中在画面的右侧，为左侧留出大片干净的背景区域，以实现黄金分割和不对称的美感，方便后期排版添加详细文字。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

提示词：

数块大小不一的几何金属板，以一种优雅的解构主义方式悬浮在画面的左侧。整体材质为带有细腻拉丝纹理的哑光黑钢，边缘锋利，反射着冷峻的光泽。最大的三块垂直金属板上，分别用蚀刻工艺清晰地展示着“好产品”、“好时机”、“好宣发”的白色字样。在它们下方，几块稍小的金属板错落有致，上面刻着“找到突破”、“抢先一步”和“放大优势”。一束戏剧性的、极其锐利的聚光灯从画面外斜射而下，精准地照亮了刻有“找到突破”的金属板，使其在幽暗的环境中成为唯一的视觉焦点，并投下深邃的阴影。背景是纯粹的、无任何干扰的哑光深灰色。整个视觉主体被精心布置在画面的左半部分，在画面的右侧形成了大面积、干净的留白区域，为后期添加详细文字和标题提供了充足空间。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

这个方案应该会给现在的 AI PPT 行业带来新的实现方式，接入 Seedream 4.0 图像创作模型后加上 AI 编码在图片上进行一些简单排版就可以获得非常上流而且每次都不一样的 PPT 页面。

将你的照片变成玻璃质感的头像&图标

这个是想起来苹果要开发布会了 iOS 26 的液态玻璃效果做的，可以将你拍摄的任何照片变成玻璃图标，完全不需要修改提示词，而且模型会自己在下方加上合适的文字，你可以直接发社交媒体炫耀。

提示词：

将这张照片的景色变成一个带有照片相关渐变色，透明磨砂玻璃慢射材质，图标下方用有艺术黑体写着跟图片景色相关的英文标题，纯白背景的图标，C4D，OC渲染。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

将你的宠物变成你的护身符

在 Seedream 图像创作模型 3.0 的时候玄学护身符壁纸就帮我涨了一大波粉丝，到了 4.0 我们当然不能忘了这个非常有流量的垂类。

现在你可以上传你的宠物头像，然后让模型帮你生成长得很像你的宠物的山海经神兽许愿符了，而且我还让模型将你的宠物照片放在了生成结果上，这样就不用你自己拼图了。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

提示词：

以我上传的 [边境牧羊犬] 的样貌和神态为原型，将其幻化成一只威风凛凛的山海经神兽。神兽保留着宠物的特征，但体型巨大化，身披荧光彩绘的鳞甲与符文，体态线条夸张而充满力量，眼神睥睨，仿佛在守护一方天地。

主体为以复古票据为原型，米黄底色，外围有繁复绿纹边框。

背景是充满张力的水墨风《山海经》世界，远山如黛，怪石嶙峋，周围有其他鬼怪异兽的虚影在云雾中若隐若现。

在画面的 [左下角或右下角]，有一个类似高科技悬浮屏幕（或古老卷轴）的设计，这个屏幕（或卷轴）上清晰地展示着我上传的宠物原始照片，旁边还有一些类似“原型体”、“灵力值”的数据标签和神秘符号。

荧光彩绘，夸张线条，现代潮流与古典神话碰撞，绚丽色彩，前卫艺术，非常规构图，冲击力，张力，情绪释放，创新，写实细节，梦幻光影，水墨电影感。

顶部和底部有重复英文 'EVERYTHING GOES WELL'，中间 'GOOD LUCK'，两侧竖排英文 'LIFE IS SHORT WHY NOT TRY'，中央用粗犷黑笔写着 '逢考必过'，周遭簇拥竖排小字，底部有英文 'Wish you all the heavenly blessings' 与红色篆刻印章的画面，国潮票据场景，复古花纹、书法狂草、篆刻印章与英文标语碰撞修饰，纸张边缘粗糙磨损，纸张纹理，红色印章突出清晰

定制你自己的玄学鼠标垫

搞完上面的宠物许愿符以后我突然看到了自己的桌面，这不是完美的玄学商品载体吗？

于是就搞了提示词将鼠标垫换成许愿鼠标垫，发出去之后很多朋友希望做成实体，做电商的朋友们靠你们了。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

提示词：

请将图片中涂抹的区域，替换成一个全新的、超写实风格的布艺鼠标垫。

鼠标垫设计要求：

设计主题：鼠标垫的整个表面，需要完美地印刷上一个国潮护身符票据的图案。

图案细节：这个票据图案以复古米黄为底色，外圈有复杂的绿色花纹边框。顶部和底部是重复的英文 'EVERYTHING GOES WELL'，中间有大写的 'GOOD LUCK'，两侧是竖排的 'LIFE IS SHORT WHY NOT TRY'。

核心祝福语：在鼠标垫正中央，用极其粗犷、充满力量感的黑色书法狂草写着"代码无Bug / 甲方闭嘴 / 需求不改 / 摸鱼万岁"。

辅助元素：祝福语周围簇拥着许多竖排的、模糊不清的祈福小字。在图案的右下角，有一个非常清晰、显眼的红色篆刻印章，印章内容可以是“心想事成”或类似的吉利话。

纸张质感：尽管是印刷图案，但要表现出原始设计的纸张纹理，以及纸张边缘自然的粗糙磨损感。

与环境融合要求 ( realism is key! )：

完美替换：新生成的鼠标垫必须完全遵循原始鼠标垫的形状、大小和透视角度，无缝地融入到照片环境中。

材质表现：鼠标垫的材质应为高品质的细纤维布面，在图案上能看到极其微妙的布料纹理，边缘最好有精密的锁边设计。

光影一致：必须严格遵守原照片的光照环境。台灯或屏幕的光照要自然地洒在鼠标垫表面，键盘、鼠标或其他桌上物品投射在鼠标垫上的阴影，要被完整且逼真地保留下来。

无缝衔接：如果原始鼠标垫有部分被键盘、水杯等物品压住，生成的新鼠标垫图案也必须自然地出现在这些物品的下方，不能有任何穿帮或覆盖的痕迹。

为自己和偶像制作创意头像

这是我发的第二个 Seedream 4.0 的案例，没想到发出去直接就爆了，小红书一堆参考提示词的人 @ 我，这还没包括没提我名字的。

今天上午阿真还说已经有人开始用这个提示词给其他人定制头像了，疯狂赚钱，火山引擎上了 API 之后马上就能自动化了，加油啊朋友们。麻了，藏师傅现在是 AI 小生意的发源地了。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

我昨天发了之后看到还有朋友不会用，需要将下面这张图片放在第一张图，然后将你想要生成头像的照片放在第二张图，然后输入提示词就行。

参考图1的风格和样式为图2的角色生成一个图标，同时只要参考图2的头部位置，像一个头像图标，图标下方的文字应该为“Jinx”

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

垫了下 Darius Dan这个画头像老哥的图，他手绘的一套图标卖几十美元，不过注意自己玩可以不要盈利哈，尤其是垫图这种方式。

无痛 Cos 你喜欢的动漫或游戏角色

Nano Banana 做手办火了一波，日常二次元那么少，结果一玩图片人人都是二次元， Seedream 4.0 图片可以玩更猛的。

你只需要上传你的照片和想要 Cos 的角色图片就可以无痛 Cos 你喜欢的角色了，真实度和人脸还原度相当高，他还把我的脸型修了一下让我更像贝吉塔。

让图1的穿上图2角色的写实质感的服饰和发型。并在图1的环境中摆出同样的姿势，不要改变人脸，发型和服饰需要更真实像实拍

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

当然也可以让你喜欢的偶像 Cos 你喜欢的动漫或者游戏角色，相比每个动漫改真人剧集的时候你都有自己心目中的主角人选吧，现在可以实现你的心愿了。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

上传图片自动生成手帐风格日记

由于 Seedream 4.0图像创作模型有一定的世界知识和视觉推理能力，我就在想那是不是我们就可以直接把今天拍的照片给他，让他帮我们记日记呢？

探索了一下提示词发现真的可以！你可以上传自己今天拍的图片，告诉他今天的日期和天气，他就会帮你生成一个手帐风格的日记图片了。

你还可以把今天的自拍放上去，他就会帮你生成一个手绘形象在页面上，注意提示词写的人像放在第四张图。

提示词：

帮我生成一张图片，根据图片内容帮我模拟在一张略带纹理的纸张上（米黄色或者浅棕色）手写的关于今天的日记。所有的图片以拼贴画风格放在一页日记上，包含以下元素：

用手写字体描述今天做了什么，以及一两句吸引人的标语或简介，包含几张图片的介绍，用红色笔迹或其他亮色圈出或用箭头指向特别推荐的地点或活动。穿插一些与图片特色相关的简单涂鸦式小图画，写着标题“2025 0909 ”“北京晴 28°”，并添加一个图 4 角色的手绘形象

整体感觉要像一份由热爱生活的作者精心制作的、生动有趣的个人日记。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

你完全可以用这套提示词做一个日记应用，然后把用户每天的日记放在一个写实虚拟的日记本里面，做个拟物化的动画绝对卖疯了。

修改任意UI设计稿或者海报

在图像理解和视觉推理上 Seedream 4.0 模型真的很厉害，基本需要很简单的提示词就可以对复杂的图片做出合适的修改。

比如这里我只让他根据图 2 的配色改图 1 的设计稿，他完美的搭配了色板的颜色，知道哪些该用在文字上哪些该用在卡片背景和图标上。

图1 UI设计稿改成图2配色

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

当然也可以直接改设计稿内容，你只需要跟他说主题就行完全不需要说具体的要求，比如这里我就只说改成星巴克主题，他自己就虚构了合适的文案和图标。

改变图中网页内容，将主题变为星巴克网站，只替换文字和图片，不改其他内容

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

前面说的 PPT 方案是为了产品化做的，你当然也可以给他参考图让他帮你改成你想要的内容和文字就行，这叫什么“拼好图”？

提示词：帮我生成一个作品集封面，参考图 1 的排版和内容，图 2 的背景颜色和文字配色，并将“2022”改为 “2025”

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

自媒体神器-多风格知识卡片

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

既然说到了世界知识和智能程度，那就必须把我们的知识卡片发扬光大了，之前 Nano Banana 的知识卡片只能生成英文非常可惜。

现在有了 Seedream 4.0 终于可以肆无忌惮的整了，我整理了一套知识卡片提示词模板，你可以基于这套模版生成任何风格任何受众的知识卡片。

只需要更改下面提示词方括号的内容就行，当然我也给了一些参考风格你也可以直接用。

提示词模板：

生成一张 [格式/载体] 风格的图像，向 [目标受众] 解释/展示 “[可替换的核心概念]”。图像需具备 [风格特征A]、[风格特征B] 和 [排版要求C]，整体感觉类似于 [某个熟悉的参照物]。

这个的灵感是最近刷到有人用仙侠文案讲一些历史上著名的科学家的故事，然后就想仙侠风格的卡片搭配高科技产品反差确实强，而且吸引人阅读。

仙侠风格卡片提示词：

生成一张仙侠古籍图鉴风格的卡片，向宗门弟子介绍[电脑]。卡牌应采用水墨国风与工笔画相结合的画风，仙气缥缈，色彩淡雅。布局上，中心是主体的精细插图，旁边配有竖排的相对详细的楷体注释。卡牌四周应有祥云或卷草纹的古典边框，背景素净，有大量留白，整体质感如同一本传世秘籍中的一页。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

这个现代信息风格卡片信息是最丰富的，而且表意非常清晰，最通用。

现代信息图风格卡片提示词：

创作一张现代极简信息图（Infographic），向都市白领解释[番茄工作法]。图片应使用明亮、和谐的色块和简洁的扁平化图标，信息布局要遵循视觉引导，使用无衬线字体标注关键步骤或元素，有相对详细的文字介绍，整体风格要干净、有条理，类似于一个高端商业分析报告中的图表。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

非常炫酷的游戏风格卡片，会帮你把一些概念变成对应的游戏装备和技能，用游戏化的方式学习。

游戏装备风格卡片提示词：

设计一张幻想RPG游戏中的技能卡片，用文字和图像来解释经济学概念‘期货’。有游戏化的技能名称，卡片上有酷炫的图标、技能描述（用游戏化的语言解释概念）、消耗的‘精力值’和冷却时间。整体是暗黑奇幻风格，带有发光的魔法符文边框。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

塔罗牌风格适合讲解一些哲学和西方历史概念、人物、事件等代入感相当强，而且 Seedream 4.0 生成的塔罗牌非常有质感，恍惚间好像是立体的。

塔罗牌风格卡片提示词：

设计一张塔罗牌，用神秘学的象征手法来诠释[集体潜意识]。卡牌需要有经典的装饰性边框，中心是象征性的核心图像，底部有卡牌名称的罗马数字和标题以及中文描述。整体采用神秘、复古的版画风格，色彩象征意义丰富。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

技术宅和开发者适合用这套，看起来非常的专业。

蓝图风格卡片提示词：

生成一张技术蓝图风格的知识卡片，向工程师阐释[喷气发动机工作原理]。图像需使用经典的蓝底白线，包含精确的几何线条、尺寸标注和剖面视图，排版严谨，下方设有标题栏和图例和详细文字说明，呈现出专业工程图纸的质感。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

这种风格适合用在自然和地理科学概念上，非常应景。

博物学家野外记录风格卡片提示词：

设计一页博物学家的野外手册，向社会观察者介绍[板块构造理论]。画面应以手绘水彩风格为主，包含主体对象的精细素描、其“行为”或“特征”的图解，并配有简单的手写体的文字观察笔记。整体布局自由，带有纸张的做旧纹理和墨迹污渍，仿佛一本真正的田野笔记。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

这里我故意用教科书这种古板的表现形式表现一些时髦的现象，反差感比较强。

教科书插图风格卡片提示词：

生成一张复古科学教科书插图风格的图像，向学生解释[网络喷子]。图像应采用柔和的胶版印刷色调，带有细致的钢笔线条和简单的标签注释文字，布局清晰，包含一个主图和几个辅助小图，整体质感如同上世纪的纸质印刷品。

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

优化过的游戏风格卡片，你可以自定义游戏的背景，比如下面的赛博朋克和仙侠游戏，右边的仙侠游戏这个卡片效果太好了，你跟我说这是真实游戏截图或者素材也信。

幻想RPG游戏中的技能说明卡片：

生成一个幻想RPG游戏中的技能说明界面，向玩家介绍[复利效应]。界面需包含一个代表该概念的像素艺术或手绘图标、技能的名称、稀有度（如：传说、史诗）和简单的文字描述，以及一段用游戏化语言风格写成的描述文字。整体UI设计要有仙侠游戏风格

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

好了这就是今天的全部教程内容了。

希望能对你有些启发，目前 Seedream 4.0 图像生成模型已经在火山引擎全量上线，如果看到上面这些案例手痒了可以搞一个自己的产品，现在的开发成本真的很低了。

我随手在便利贴上画了三条波浪线，拍照丢进模型，补一句“玻璃质感”。它把歪歪扭扭的线当成光路，在图里折出厚度，像把草图直接吹成玻璃雕塑。那一刻我突然明白：提示词不是“写给 AI 的句子”，而是“递给模型的任意线索”——声音、草图、视频截帧、甚至手机陀螺仪的抖动数据，只要它能被编码成向量，就能成为对话的开头。

于是“写提示词”这件事被拆成两步：

1.先问自己“我手里有什么现成的碎片？”

2.再补一句“我想让它变成什么质感？”

碎片越随意，模型越能把你的个人噪声当成风格指纹；补的那一句越短，留给它的翻译空间越大。就像把一块贝壳交给海浪，它冲回来的是磨掉棱角的玻璃，而不是贝壳说明书。

所以，关掉教程之后，别急着“写一段更好的提示词”。先低头看看四周：

外卖袋的折痕

地铁玻璃的雾气

昨晚没喝完的咖啡表面那层油脂纹理

拍下任意一块，扔进火山引擎，补一句“做成头像”“做成 PPT 背景”“做成护身符”。第一次生成的图可能不像样，但你会亲眼看到“个人垃圾时间”如何被翻译成“公共可见的美学”，再用火山引擎的其他模型做成产品。这比任何课程都更快地告诉你：AI 时代的“原创”，不再是从零到一的创造，而是从生活碎片到可交付产品的翻译——而翻译机已经架好，就等你把碎片投进去，能火的 AI 内容不是脱离现实创造而是加工现实。

如果你愿意，欢迎把你随手拍的“碎片翻译”发到评论区，甚至是用火山引擎把他做成产品。世界早就在我们口袋里，只是需要一次“扔进模型”的动作，才被重新看见，并且被标好了价格。

文章来自于微信公众号“歸藏的AI工具箱”。

AI作图 AI作图教程提示词 Seedream 4.0 Seedream 4.0教程

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0