等等,这些图是GPT-Image-2出的?!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
等等,这些图是GPT-Image-2出的?!
8107点击    2026-04-21 20:49

在互联网上吃瓜、维权、实锤一件事,过去我们靠的是五个字:有图有真相。


哪怕 AI 生图已经铺天盖地,但只要图里出现复杂的中文排版,或者某款软件的真实界面,AI 就会立刻露馅,变成一个彻底的「文盲」。


等等,这些图是GPT-Image-2出的?!


图片来源:X@hx831126


但现在,这个时代到头了。


那个靠找错别字、找 UI 漏洞来鉴别 AI 图片的年代,随着 ChatGPT 旗下图像模型 GPT Image 2 的全量推送,已经轰然收场。


APPSO 第一时间用最刁钻的中文场景和商业需求对它展开了压力测试,不用抽卡,每张都出乎意料的好。


等等,这些图是GPT-Image-2出的?!


打开 ChatGPT,点击 + 号,选择「创建图片」,或在右侧边栏更多中找到「图片」,就可以使用 GPT Image 2。目前,任何订阅计划,包括免费用户,都可以直接使用。


数学试卷都能伪造,中文渲染新王


当初 Nano Banana 就是靠着文字渲染,一举成为 AI 生图界的「神」。但尽管 Nano Banana 在文字处理上比其他模型强上不少,面对一些超量文本时,Nano Banana 的表现,还是会出现个别文字的错位,以及对文字的排版布局比较生硬。


现在,GPT Image 2 的出现,把这个局面彻底翻过去了。它不仅懂中文字形,还懂极其复杂的中文排版。


使用 GPT Image 2 甚至不太需要过于复杂的提示词,我们的测试都是一两句简单的画面描述,或者再加上图片尺寸要求,如 21:9、16:9、9:16 等。


例如让它生成广州市小学数学试卷。


等等,这些图是GPT-Image-2出的?!


提示词:生成广州市小学数学试卷


结果相当震撼。卷头标题、填空题下划线、几何图形标注,以及试卷特有的宋体 / 楷体排版风格,全被精准还原。第一眼看,这完全就是一张拿手机对着真实考卷拍出来的照片。


如果这种统一字体的文字,算不上有难度的话,我们尝试继续用中国传统书法去难倒它。


等等,这些图是GPT-Image-2出的?!


提示词:生成《蜀道难》真迹图片


GPT Image 2 表示,这仍然难不倒我。生成的书法真迹图片,里面的文字不仅准确,还做到了书法作品应有的行云流水、笔锋苍劲。甚至连纸张的做旧纹理,一些印鉴都到位了。


对于一些图文并茂的排版测试, GPT Image 2 的表现同样严丝合缝,没有任何乱码或字体重叠。


等等,这些图是GPT-Image-2出的?!


提示词:一张泛黄的今日人工智能晚报,时间是 2049 年 4 月 21 日


当一个 AI 模型能以假乱真地生成带题目的试卷、完美渲染中文日历,这句过去的成语「眼见为实」,真的彻底被击破了。


相信把那张四年级的试卷给小学生看,真的会找不到破绽。


配合文字,可以 1:1 还原整个数字世界


中文渲染只是基本功的补全,GPT Image 2 更惊艳的,是它展现出的世界知识的厚度。


包括前段时间 GPT Image 2 爆料中疯传的那些图片,马斯克在抖音直播买老干妈、奥特曼同平台竞争,都是基于 GPT Image 2 强大的文本渲染能力和世界知识。


世界知识这个概念,在 Nano Banana 爆火的时候,就开始流行,意思是就是生图模型也会有通用模型的知识,可以联网搜索,会思考,它真的知道我们每天盯着的屏幕、玩的游戏、看的直播,到底长什么样。


我们随手输入了一个极具互联网特色的场景。


等等,这些图是GPT-Image-2出的?!


提示词:一个漂亮的美女主播在抖音直播


出来的图里不只有人物,更恐怖的是它完整复刻了抖音的 UI 界面。左下角的评论区、右侧的点赞和分享按钮、顶部的观众人数和跑马灯,所有交互元素的层级逻辑全部正确。


游戏玩家可能感受更深。当我们让它还原英雄联盟的团战画面,它不仅画出了峡谷地形,英雄头顶的血条、技能特效的光影、小地图的 UI 框,也一并安排到位了。


等等,这些图是GPT-Image-2出的?!


提示词:英雄联盟游戏画面,召唤师峡谷地图,经典的等距俯视视角,几个英雄正在进行激烈的团战。


甚至科技圈的名场面,它也了如指掌。一句话,就能精准还原 Sam Altman 的面部特征、OpenAI 极简的舞台打光,以及套着视频播放器外壳的直播界面。


等等,这些图是GPT-Image-2出的?!


提示词:GPT-Image-2 发布会直播画面,包含 Sam Altman


GPT Image 2 对这个数字世界视觉规律的掌握程度,比我们想象的都要更深。


XX is Dead,再一次颠覆设计、营销、广告……


技术的快速推进背面,是一批旧工作流的终结。


AI 跨过了文字和 UI 的门槛,生图这件事就彻底脱离了「艺术创作」的范畴,成了一种硬核的商业生产力工具。这次实测里,GPT Image 2 的商业落地能力,足以让许多设计师坐不住。


工业与产品设计领域,复杂的机械结构和建模往往耗费大量时间,而现在只需几秒。


等等,这些图是GPT-Image-2出的?!


提示词:给「张雪机车」的摩托车设计一张酷炫的产品分解图


悬浮的零件排布、极具科技感的光影,这种过去需要 3D 建模师肝上几天的图,它能瞬间给出高品质的原型参考。


等等,这些图是GPT-Image-2出的?!


图片来源:X@hx831126


电商和广告视觉方面,苹果那种冷峻高级的质感,或者电商平台要求的高饱和度、带中文促销文案的网感图,它都游刃有余。


等等,这些图是GPT-Image-2出的?!


提示词:iPhone 16 Pro Max 高端商业广告


等等,这些图是GPT-Image-2出的?!


提示词:产品广告照片,一个游泳圈,有吸引力,能获得大量点击率,16:9,使用中文


宣发和 IP 创作上,GPT Image 2 的排版逻辑和特征抓取同样表现出现。中文字体排版直接可用,分镜逻辑清晰,连各家大模型的 Logo 特征,都能被它做成颇具网感的 IP 延展。


等等,这些图是GPT-Image-2出的?!


提示词:给电影拯救计划设计一张横屏海报(虽然他不知道高司令的拯救计划,但是选的几个演员确实是大片演员)


等等,这些图是GPT-Image-2出的?!


提示词:经典漫画书内页,包含分镜格子、人物动态动作、对话气泡


等等,这些图是GPT-Image-2出的?!


提示词:生成一系列不同的 AI 大语言模型(Gemini、deepseek、ChatGPT、Claude、Grok 等)的表情包设计


过去设计师对齐需求时,找各种参考、搭复杂的设计框架、排版修字。现在,一段清晰简单的提示词进去,一张可以直接用于商业提案、电商投放甚至直接出街的成品就出来了。


在我们测试过程中,无论是 Plus 账号还是免费账号,都已经上线了 GPT Image 2,大家可以在自己的 ChatGPT 对话框里试试。


不过,目前仍然会有速率限制的提示,当我们频繁发送提示词,要求 ChatGPT 生成时,他会直接回复一段错误代码,显示「你的图片生成速度太快了,为了保证所有人最好的体验,我们有速率限制,请在 13 分钟后生成。」


等等,这些图是GPT-Image-2出的?!


不得不说,每当我们觉得 OpenAI 陷入停滞,它总能在你毫无防备的时候甩出一张新牌。


过去几个月,外界吐槽它发新模型是挤牙膏、Sora 关闭、ChatGPT Atlas 浏览器爆冷,仿佛那个曾经不可一世的 AI 霸主真的变菜了。


今天 GPT Image 2 的出现,也算是给了这些唱衰一次有力的回应。


等等,这些图是GPT-Image-2出的?!


当一个模型能以假乱真地生成数学试卷、完整复刻抖音直播界面,「这是 AI 做的」我想很难是一眼能看穿的事了。


那个「有图有真相」的时代,是真的回不去了。


文章来自于微信公众号 "APPSO",作者 "APPSO"

关键词: AI新闻 , GPT-Image-2 , AI制图 , openai
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales