GPT-Image-2爆火半个月后,我采访了10个普通人

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
GPT-Image-2爆火半个月后,我采访了10个普通人
7071点击    2026-05-02 13:35

GPT-Image-2爆火半个月后,我采访了10个普通人


GPT-Image-2发布半个月后,我本来不太想再写它了。


这半个月里,关于它的测评和教程,已经被写得差不多了。


中文生成、角色一致性、海报设计、产品图、手办、电影分镜,以及那个永远不会缺席的问题:


它会不会杀死设计师。


这些都重要。


但我更好奇的是另一件事:


当AI生图真的开始被普通人使用,它会先被用在哪里?


后来我发现,答案不在发布会,也不在测评视频里。


它出现在一些很小的地方。


这些地方没有那么像新闻。


但它们更像生活。


所以这次我没有继续测模型或者写Prompt分享。


而是去找了10个身边的普通人,问他们怎么开始用AI生图,又为什么会在这些具体的小事上用到它。


文中的人物均为化名,部分细节做了合并处理,并且为了保护受访者隐私,本文中所有的示例均为作者重新制作。


PART.01


她终于做出了一张不像模板的海报


THUMB


STOPPING


第一个人,是杭州一个社区花店老板。


我叫她林姐。


我认识她,是因为之前给朋友订过一次生日花。


那天我到店里等她包花。店不大,门口摆着几桶刚到的花,玫瑰、洋桔梗、向日葵,还有一些我叫不上名字的配花。


她一边剪枝,一边看电脑。


电脑屏幕上,是一张正在做的母亲节海报。


粉色背景,几朵康乃馨,一行金色艺术字:


「感恩母亲,爱在花间」。


那种海报你一定见过。


每年母亲节、七夕、教师节、圣诞节,很多小店都会发类似的图。它不算错,也不算难看得离谱,但你看一眼就知道,它来自某个模板网站,或者某个淘宝设计师的素材库。


GPT-Image-2爆火半个月后,我采访了10个普通人


后来聊天才知道,她每到节日前都要为这些图发愁。


朋友圈要发,社群要发,小红书要发,店里有时候还要打印出来贴在门口。


她试过模板,问题是模板太容易撞款。隔壁蛋糕店、楼下美甲店、附近咖啡店,大家用的版式都差不多,只是中间那张产品图换了。


她也试过找淘宝和闲鱼上的设计师。便宜的,出来还是模板味。稍微好一点的,单张价格对她这种社区小店又不太划算。


最后大多数时候,她只能自己套素材,找一张花的图,配一段节日文案,再把字体调大一点。


她不是不知道土,她只是没有更好的办法。


很多小商家其实都有审美。他们每天面对真实顾客,比很多坐在办公室里讲品牌的人,更知道什么东西会让人觉得舒服。


林姐想要的七夕海报,不是满屏玫瑰、爱心、金色飘带。


她想要的是傍晚街角的小花店,灯光暖一点,花束放在门口,有一点日剧里那种安静的氛围。


但这个感觉很难变成一张图。


你说给设计师听,对方大概率会问:


「有参考图吗?」


没有参考图,沟通就会变得很长。找参考图本身又是一件很累的事。


所以很多小商家最后都会退回到最稳妥的选择:用模板。


直到最近,我发现她朋友圈里的图突然变好看了。


不是那种一眼就很贵的设计。它还是很简单,但画面终于有了一点她自己店里的味道。


有一张图,是七夕花束放在街角门口,门里透出暖光,旁边有一个小木牌,写着当天可以预订。


不像广告。


更像一个人下班路过时,会停下来多看一眼的小店。


我顺手问她,是不是换了设计师。


她说没有。


是朋友转给她一篇教程,教她怎么用GPT-Image-2作图。她照着试了几次,发现真的能用。


她说得很朴素:


「我也不用它画得特别高级,能不像以前那么土就行。」


这句话很小,但很准。


对林姐来说,GPT-Image-2不是用来炫技的工具。


她不关心它背后是什么路线,也不关心它到底领先谁。她只关心下一个节日来的时候,自己能不能做出一张看起来像自己店的图。


这件事放在AI圈里很小。


小到没人会为它写技术分析。


但对一个小店老板来说,它很具体。


一张图不好看,顾客不一定会骂。但她自己知道,那张图不像她的店。


以前她只能忍。


现在她至少可以说:


「我想做一张七夕花束海报,不要太俗,像傍晚街角的小花店,有一点日剧感。」


然后很快得到一张非常精美和优质的海报。


GPT-Image-2爆火半个月后,我采访了10个普通人


后来我发现,类似的变化不只发生在花店。


我之前看房时加过一个北京中介,叫阿城。最近我刷到他朋友圈,发现他开始发老房改造前后对比视频。


前面是一套很普通的老房子。墙面发黄,地板有点旧,采光一般,家具也明显是上一代人的审美。


后面突然变成奶油风、日式原木风,或者适合年轻人出租的低成本改造风。


一眼能看出来,是AI生成的。


但也确实有用。


我问他为什么开始做这个。


他说,卖老房子最麻烦的地方,不是客户完全不信你。很多客户知道房子不是不能买,位置可以,户型也可以,价格也还能谈。


但他们看不见改完之后会怎样。


GPT-Image-2爆火半个月后,我采访了10个普通人


中介说:


「这个户型其实很好改。」


客户也点头。


点完头以后,脑子里还是那套墙面发黄、地板很旧、灯光昏暗的房子。


他们不是不理解。


是没有画面。


阿城用AI跑出来的图当然不能直接当装修方案。有些细节会不合理,窗户比例不对,柜子位置奇怪,甚至会把承重墙想得过于自由。AI对房屋结构的敬畏心,和某些装修公司差不多,大家半斤八两。


但它解决了第一步:


让客户先看见可能性。


以前客户问:


「这房子能改好吗?」


现在客户会问:


「如果做成这个风格,大概要多少钱?」


这一步就很重要。


我还想到另一个朋友,阿强。他在北京做纹身。GPT-Image-2出来后,我转给他看,他说准备拿去试试。


他跟我说,纹身这一行最麻烦的,不是客户说不清审美。


是客户在看到上身效果前,很难下决定。


纹身不像买衣服。


衣服不喜欢可以退,可以换,可以压箱底。


但纹身一旦落到皮肤上,就会变成身体的一部分。


所以很多客户前面聊得很兴奋,参考图也看了很多,图案也觉得不错。可到了确定位置、大小、风格的时候,又开始犹豫。


「这个放在胳膊上会不会太显眼?」


「线条会不会太重?」


「会不会现在觉得好看,过两年就后悔?」


这些问题不是客户矫情。


是他们看不见那个图案落在自己身上之后会是什么感觉。


GPT-Image-2对阿强的作用,不是替他设计纹身,而是帮客户先看到一个接近真实的预览。


GPT-Image-2爆火半个月后,我采访了10个普通人


图案贴在胳膊上是什么比例。


放在小臂内侧会不会太满。


穿短袖露出来时,会不会比想象中更强烈。


这些东西以前只能靠脑补,现在至少可以先看到一版。


客户不一定立刻决定。


但他开始知道自己在犹豫什么。


这对很多手艺人都一样。美甲师、发型师、花艺师、婚礼策划师,每天面对的都是类似的问题:


客户知道自己不要什么,但说不清自己要什么。


所以小生意人用AI生图,最核心的变化不在于省钱。


省钱当然重要。


但更重要的是,他们终于有了一张可以拿出来沟通的图。


花店老板需要让节日氛围被看见。


房产中介需要让未来生活被看见。


纹身师需要让客户说不清的感觉被看见。


这些事情过去要靠模板、外包、图库、口头描述和客户脑补。


现在至少可以先生成一版。


它不一定完美。


但它给普通小商家一个起点。


不用每次都在「太土」和「太贵」之间选一个。


PART.02


那个新人记者,不想再用重复素材了


THUMB


STOPPING


第二类人,是内容创作者。


我认识一个北京新人记者,叫小赵。


2024年一个AI创业者饭局上,他来报道创业者,坐在旁边一直记东西。桌上有人聊Agent,有人聊融资,有人聊模型能力,他听到不懂的地方就追问。


认真,也有点紧张。


那天吃饭时,我问他:


「你们做记者的,最痛苦的地方是什么?有没有一些地方是AI真能帮上忙的?」


他想了一下,说配图。


他说自己之前写过一篇报道,讲AI时代普通人的工作方式变化。文章本身写得很顺,但到了配图这一步,还是只能去网上找。


那时候AI生图模型还不稳定。


生成出来的图经常很丑,要么过度塑料,要么像游戏概念图,要么人物和文字细节一塌糊涂。


更麻烦的是,它需要大量prompt。


镜头、光影、构图、风格、材质、场景关系,都要描述得很细。


小赵说,他不是不会写文章,但他确实没有这个能力。


他写的是报道,不是AI绘画教程。


所以最后,他还是回到了最熟悉的办法:


去网上搜图。


写AI,就搜AI;写Agent,就搜机器人办公。


最后搜出来的图都差不多。


蓝色渐变,机器人握手,地球,发光线条。


那种熟悉的「科技感」,熟到像2019年WAIC大会剩下的物料。


这不是小赵一个人的问题。


他说这件事很无奈。


因为他明明想写的是一个很具体的变化:


AI时代,普通人的工作边界正在被放大。


但配图最后还是变成了一个机器人和人握手。


能用,但没有记忆点。


更重要的是,那张图和他的文章没有关系。


它只是看起来像一篇AI文章。


这也是很多内容创作者都会遇到的问题。


文字里有判断,有隐喻,有具体场景。


但图跟不上。


过去内容配图,核心动作是「找」。


找截图,找素材,找表情包,找别人已经做过的视觉风格。


找到一张差不多的,就放上去。


这很正常。


内容创作者每天都在跟时间赛跑。一个热点从出现到过气,可能就几个小时。文章要写,标题要想,封面要做,配图也要准备。


没人真的愿意为了一张配图耗一天。


所以大多数时候只能差不多。


但GPT-Image-2出来之后,这个动作变了。


以前是找图,现在可以造场景。


小赵后来开始用它做报道配图。


写Agent办公,他不再放机器人握手,而是生成一个普通人的办公桌面。电脑旁边漂浮着邮件、日程、文档和任务流,背后像有一套系统在自动处理信息。


写模型发布,他不只放发布会截图,而是做一张像报纸头版一样的视觉。


写AI创业,他把创业公司画成一个很小的工作室。几个人围着白板讨论产品流程,桌上放着咖啡、电脑和一堆没整理完的便签。


这件事对内容创作者很重要。


因为配图不是装饰。


它很多时候是文章的第二个标题。


标题让人点进来。


图让人觉得这里面可能有点东西。


尤其写AI这种题材,如果所有文章都用同一种蓝色科技风,读者很快会失去分辨能力。


你写Agent,他写模型,另一个人写融资。


最后看起来都像同一张展会背景板。


后来我在一次媒体活动上,又认识了一个广州家居博主,小鱼。


她做小红书,账号不算特别大,但更新很勤。她说自己最痛苦的不是写内容,是做封面。


同样是「租房卧室改造」。


同样是「低预算提升房间氛围」。


同样是「打工人下班后的疗愈角落」。


内容差不多,封面差一点,点击率可能完全不同。


她以前主要靠模板。模板的问题是,改起来很笨。想从真实生活流换成杂志感,基本等于重做一遍。想做前后对比,又要重新搭版式。


她也试过一些AI图片工具,比如nano banana刚出来的时候,她也去试了。但效果不太稳定。很多图单看还行,真放到小红书封面里就不对。


要么太假。


要么太精致。


要么像样板间,少了普通人生活里那点乱和温度。


GPT-Image-2对她有用的地方,是可以快速出不同风格能用的封面图。


GPT-Image-2爆火半个月后,我采访了10个普通人


同一篇笔记,她可以先跑十种封面。


真实生活流、杂志感、前后对比。


更温柔、更冲突、更像刚下班回家打开灯的瞬间。


她不一定直接用第一张。


但她可以很快知道哪个方向更对。


过去她是在一张图上反复修。


现在她可以先把十个方向铺开,再决定往哪一张上继续改。


小赵和小鱼面对的是同一件事。


一个写报道,一个做小红书。


一个需要让观点有画面,一个需要让封面停住手指。


以前他们问的是:


「哪里有一张图能表达这个意思?」


现在他们问的是:


「我脑子里的这个画面,能不能先做出来?」


这就是GPT-Image-2对内容创作者的意义。


它不是一个更高级的图库。


也不是一个更高级的模板库。


它让内容创作者从找素材,变成造场景。


而一旦画面可以被快速生成,真正重要的就变成了另一件事:


你脑子里有没有一个值得被画出来的场景。


PART.03


老师和产品经理,都需要一张讲得清的图


THUMB


STOPPING


第三类人,是那些每天都在努力把复杂东西讲清楚的人。


一个是地理老师。


一个是大厂产品经理。


我先说陈老师。


她是我一个朋友的姐姐,教初中地理。朋友之前看我写AI工具,跟我说了一句:


「你们AI圈天天讲模型,其实我姐这种老师才最需要。」


陈老师最头疼的,不是备课内容。


是找图。


讲水循环,要找图。


讲季风气候,要找图。


讲城市热岛,要找图。


讲板块运动,也要找图。


这些知识点光靠文字讲,学生很容易走神。但找一张真正合适的图,并不容易。


网上当然有很多图。


问题是,每张图都不太一样。


有的像教材截图,有的像十年前的科普网站,有的清晰度很低,有的水印还没去干净,有的重点太复杂,初中生看了反而更晕。


最后一页PPT做完,里面堆着不同来源、不同画风、不同清晰度的素材图,像一次百度图片考古现场。


这件事听起来很小。


但对老师来说,是每天都会遇到的问题。


她不是想把课件做成什么艺术作品。


她只是想让学生看懂。


水是怎么蒸发、凝结、降水,再回到地面的。


城市为什么比郊区更热。


季风为什么会从海洋吹向陆地。


板块为什么会碰撞、分离,形成山脉和地震。


这些东西如果能有一张更准确、更统一、更适合课堂的图,讲起来会轻很多。


GPT-Image-2对她的用处,就在这里。


她可以直接写:


「画一张适合初中生理解的水循环图,风格像教材,标出蒸发、凝结、降水、径流。」


GPT-Image-2爆火半个月后,我采访了10个普通人


也可以写:


「画一张城市热岛效应示意图,左边是郊区,右边是城市,高楼、道路和温度差异要明显。」


GPT-Image-2爆火半个月后,我采访了10个普通人


这些图当然不能直接替代教材。


但放进课堂PPT里,已经够用了。


至少它更贴近她真正想讲的知识点。也不会再让一堂课的课件,看起来像从十个网站临时拼出来的。


后来我想到另一个人。


阿梓,某互联网大厂产品经理。


我认识他,是因为之前出去分享时,提到自己有些PPT里的图是用AI生成的。分享结束后,他加了我微信,第一句话就是:


「你那个图怎么做的?」


后来他给我发了一份PPT。


内容其实不错。有用户分析,有业务路径,有产品判断,也有后面的执行计划。


但视觉上很痛苦。


大段文字,流程框,箭头,蓝灰渐变,还有那种国内AIPPT工具最爱生成的「商务科技感」背景。


看起来不像产品方案,更像公司老内网的公告。


这也是很多打工人的真实处境。


他们不是没有想法,也不是不会做事,但一到汇报,就会被PPT拖住。


一个本来想得很清楚的方案,放进一堆文字框和箭头里,突然就显得很虚。


尤其在大厂里,很多时候你把事情想明白还不够。


你还要让别人相信你想明白了。


这件事有点荒谬,但很现实。大家嘴上都说只看内容,真到了会议室里,版式、结构、图示,都会影响别人对方案的第一判断。人类开会就是这么肤浅又正式,挺壮观的。


阿梓以前也试过一些AIPPT工具。那些工具可以很快生成一整套PPT,标题有了,图标有了,流程图也有了。


但很多页面看起来都很像。


像一套没有灵魂的企业培训材料。


他真正需要的,不是AI帮他凑够30页。


他需要的是几张能把关键问题讲清楚的图。


比如用户从看到内容,到产生兴趣,到完成转化,再到复购的路径。


比如一个产品从工具变成Agent之后,用户工作流会怎么改变。


比如AI客服和人工客服之间怎么分工。


这些东西用文字写,会很重。


用流程框画,又很像工作汇报里的自我折磨。


GPT-Image-2对他的帮助,是把这些抽象概念先变成一张可以讨论的画面。


比如他要讲产品内的「AI客服协作流程」。


以前可能就是几个方框:用户咨询、机器人回复、人工介入、工单流转、满意度反馈。


现在他会先生成一张更直观的场景图:


一个客服工作台,左边是用户问题,右边是AI整理出的建议回复和风险提示,中间是人工客服在做最后判断。


GPT-Image-2爆火半个月后,我采访了10个普通人


图本身不复杂。


但别人一眼能看懂他想说什么。


陈老师和阿梓看起来完全不一样。


一个在教室里讲地理,一个在会议室里讲产品方案。


但他们遇到的是同一个问题:


复杂东西只靠嘴讲,很慢。


只靠文字写,很重。


一张合适的图,可以让别人更快进入你的思路。


GPT-Image-2降低的,不只是做图成本。


它降低的是普通人解释复杂问题的成本。


以前这张图要靠搜索、拼接、模板、设计资源,或者很强的视觉表达能力。


现在,至少可以先做出第一版。


有些事情,讲十分钟不如画一张图。


以前难的是,那张图很难出现。


现在它终于可以先出现了。


PART.04


孩子说,猫要去月亮上吃火锅


THUMB


STOPPING


第四个故事,很轻。


一个妈妈,和她快3岁的孩子。


我叫她阿敏。


她是我高中同学,新手宝妈。前阵子我刷朋友圈,看到她发了一张图。


一只橘猫穿着宇航服,坐在月球上吃火锅。旁边还有一个小机器人。火锅里飘着几颗星星。


图不算特别精致,但很有意思。配文大概是在炫耀小孩的想象力。


我一开始以为是她自己随便生成来玩的。


后来才知道,那是她儿子睡前说出来的。


那天孩子突然说:


「妈妈,我想看我们的猫去月亮上吃火锅。」


这句话如果放在以前,大人最多会笑一下,然后夸一句:


「宝宝想象力真丰富。」


然后灯一关,故事就结束了。


但这次,阿敏真的把这句话输进了GPT-Image-2。


几分钟后,那只在月球上吃火锅的橘猫就出来了。


孩子看到以后,反而更兴奋。


他说旁边还要有一个机器人朋友,火锅里要有星星,猫猫要有点害怕,但又很馋。


于是这个画面被继续改。


一开始只是孩子睡前随口说的一句话。


后来变成了一张可以一起看的图。


再后来,变成了一个可以继续讲下去的小故事。


GPT-Image-2爆火半个月后,我采访了10个普通人


这个场景很小。


但我觉得它很能说明一件事:


很多时候,孩子的想象力不是没有后续,只是大人接不住。


孩子说一个奇怪的画面,大人说「真棒」,事情就过去了。


不是大人不在意。


是大人也不知道还能怎么接。


总不能真的半夜拿纸笔画一只去月球吃火锅的猫。大人们光是哄睡已经够累了,不必再额外接受美术考试。


但GPT-Image-2让这件事多了一步。


孩子负责想象。


大人负责追问。


AI负责先把画面做出来。


然后孩子继续修改。


这不是在替代孩子的想象力。


相反,它让想象力有了一个可以停留的地方。


以前那句话说完就散了。


现在它可以被看见,被讨论,被继续改。


阿敏后来跟我说,她发现孩子看到图之后,会开始说更多细节。


AI让一个随口说出的想象,变成了一段真正的互动。


这一节我不想把它讲成什么AI教育革命。


太大了,也太假。


它就是一个很普通的睡前场景。


一个妈妈,一个快3岁的孩子,一只被画出来的月球火锅猫。


但也正是这种普通,让它有意思。


GPT-Image-2在这里没有帮谁省钱,没有帮谁成交,也没有帮谁涨点击率。


它只是让一个孩子脑子里的画面,第一次有了回声。


想象力不再只停留在想象里。


它变成了可以共同观看、共同修改、共同延展的东西。


PART.05


她把小时候的客厅,重新画了出来


THUMB


STOPPING


第五类人,离「作图」反而更远。


一个是早期创业者。


一个是想留住旧房子记忆的普通人。


我先说Ray。


他在深圳,25岁,做一个很小的AI产品。我认识他,是在一个创业群里。


那天他发了自己的落地页,想让大家帮忙看看。


但群里看完以后,反应很一致:


没太看懂。


他说自己想做一个「个人信息流里的AI雷达」。


这个说法听起来有点酷,但也很容易让人困惑。


大家会问:


是RSS吗、是知识库吗、是浏览器插件吗?


还有人说:


「这不就是NotionAI吗?」


这就是很多早期创业者最常遇到的问题。


想法可能有点意思,但语言很难把它讲清楚。尤其是那种还没做成产品的东西。


你说功能,别人会把它归到已有产品里。


你说愿景,别人又觉得你在讲概念。


你说用户场景,别人听完还是没有画面。


Ray最开始也很着急。


他解释了很多遍:不是简单收藏信息,不是传统知识库,也不是一个浏览器插件。


他想做的是,当一个人每天被邮件、网页、聊天记录、文档、截图、社交媒体信息淹没时,有一个AI系统能帮他从里面抓出真正值得关注的信号。


但这句话还是很抽象。


后来他做了一张概念图。


一个人坐在桌前,周围漂浮着邮件、网页、聊天记录、截图和文档。这些信息原本是乱的。背后有一个AI系统,把它们整理成几条清晰的信号。


今天谁值得跟进。


哪条信息和正在做的项目有关。


哪些内容只是噪音。


GPT-Image-2爆火半个月后,我采访了10个普通人


这张图出来以后,群里很多人突然明白了。


它当然不等于产品。


也不能证明这个方向一定成立。


但它解决了第一个问题:


让别人知道他到底想做什么。


对早期创业者来说,第一张图不是装饰。


它经常是想法的第一张脸。


产品还没写完,设计还没定,用户还没验证,但你总要先让别人理解,你脑子里的那个东西大概长什么样。


以前这件事很难。


要么找设计师做概念图,要么自己用Figma硬拼,要么用一大段文字解释。


现在至少可以先跑出一版。


哪怕粗糙,也能拿来讨论。


Ray的故事讲的是未来。


但我听到另一个故事,讲的是过去。


她叫小雯,31岁,在上海上班。


她是一位我的读者朋友。看到我在群里聊GPT-Image-2以后,私信给我看了一张图,说她第一次觉得AI生图不只是拿来整活的。


去年她回老家,陪父母收拾准备卖掉的旧房子。


那套房子,是她从小学住到高中的地方。


房子不大,也不漂亮。厨房瓷砖已经发黄了,阳台的铁窗有点锈,客厅墙上还有以前挂钟留下的印子。


她小时候一直觉得那套房子很普通,甚至有点嫌弃。


觉得旧,乱,小。


后来去了大城市,住过更新的房子,才慢慢意识到,很多记忆其实都和那套旧房子绑在一起。


收拾东西的时候,她妈妈翻出来几张老照片。


有一张是很多年前用老手机拍的,只拍到客厅一角。像素很差,照片也有点糊,但还能看见老式木沙发、玻璃茶几、墙上的年历,还有角落里那台立式风扇。


她一眼就认出来了。


那是她每天放学回家,把书包扔在沙发上的地方。


夏天写作业时,电风扇对着吹的地方。


爸妈看电视,她坐在茶几边削铅笔的地方。


这些事情过去她都不觉得重要。


直到房子真的要卖掉了,她才发现,很多童年不是靠什么大事记住的。


是靠一个客厅、一台风扇、一张玻璃茶几,还有夏天傍晚照进旧房子里的那点光。


后来她试着用GPT-Image-2去还原那个客厅。


她写的描述很普通:


「老式中国家庭客厅,00年左右,木沙发,玻璃茶几,墙上挂着年历,电视柜上盖着白色蕾丝布,有一点拥挤,但很干净。」


图出来以后,她说最触动她的,不是像不像。


是她突然发现,自己已经很久没有认真想起过那个客厅了。


GPT-Image-2爆火半个月后,我采访了10个普通人


后来她把图发给妈妈看。


妈妈只回了一句:


「还真有点像,咱家以前就是这个感觉。」


这句话已经够了。


没有人拿它发爆款。


也没有人讨论提示词。


她只是把那张图存进了手机相册里。


这个故事和Ray的故事,看起来离得很远。


但底层其实是同一件事。


有些东西很难说清。


一个还没有做出来的产品,一个快要消失的旧客厅。


一个正在形成的想法,一段正在模糊的记忆。


它们都需要一个临时的形状。


GPT-Image-2最有意思的地方,可能就在这里。


它不只是帮人生成漂亮图片。它也让那些说不清、讲不明、快要散掉的东西,先被固定成一个画面。


但它们都说明了一件事:


有些图,不是为了发出去。


只是为了让一个人终于能说:


「对,我想表达的就是这个。」


PART.06


后记


THUMB


STOPPING


写完这10个故事后,我一直在想林姐那句话。


她说,她不需要AI把图画得多高级。


「能不像以前那么土就行。」


这句话很小,但很真实。


很多普通人用GPT-Image-2,并不是因为他们突然想成为设计师。他们只是终于遇到了一个能帮自己把话说清楚的工具。


他们要解决的这些事情都不大。


但它们共同指向一个变化:


过去,普通人脑子里有画面,但画面很难出来。


他们要靠模板、图库、PPT、参考图、口头描述,或者干脆放弃。


现在,他们至少可以先生成一张图。


这张图可能不完美,可能有错,可能还要改很多次。


但它出现以后,事情就不一样了。


花店老板可以拿它发朋友圈。


中介可以拿它和客户讨论。


老师可以拿它讲课。


创作者可以拿它做封面。


妈妈可以拿它继续孩子的故事。


一个人也可以拿它保存一段快要模糊的记忆。


这就是标题里那句话的意思。


有人用AI卖花,有人用AI留住旧客厅。


卖花,是为了把眼前的生活过下去。


留住旧客厅,是为了让过去别那么快消失。


但它们都说明了同一件事:


AI生图开始离开那些炫技场景,进入普通人的真实生活。


它开始帮普通人解决那些以前很难说清、很难画出、很难留下的小事。


这可能才是GPT-Image-2爆火半个月后,真正值得记录的地方。


不是每个人都变成了创作者。


而是越来越多普通人,开始有能力把自己的生活画出来。


感谢您的观看🥹


我是Max,一个在AI方向持续探索的小学生。


我会持续更新一些AI方向最新最快的产品,技术,思考


文章来自于微信公众号 "01Founder",作者 "01Founder"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0