高保真、多控制集成于「统一画布」,组合式图像生成新范式!
高保真、多控制集成于「统一画布」,组合式图像生成新范式!Canvas-to-Image 是一种新型图像生成框架,将多种控制方式(如身份、姿态、空间布局)整合到一个统一画布中,用户可通过直观操作生成高保真、多控制的图像。它简化了创作流程,让用户在单一界面完成复杂创作,为AI创作工具提供了新范式。
Canvas-to-Image 是一种新型图像生成框架,将多种控制方式(如身份、姿态、空间布局)整合到一个统一画布中,用户可通过直观操作生成高保真、多控制的图像。它简化了创作流程,让用户在单一界面完成复杂创作,为AI创作工具提供了新范式。
为了抢回头把交椅,OpenAI 今天正式推出了最新图像视觉模型 GPT-Image-1.5。这也是继 GPT-5.2 之后,OpenAI 红色警报计划中又一记重拳。
就在最近,豆包上新了图像创作模型 Doubao-Seedream-4.5(以下简称 Seedream 4.5)。 猜猜下面两张图片,哪张是 Seedream 4.5 生成的?哪张是最近风头正盛的 Nano Banana Pro 生成的?
老板丢下一句“要高端大气”,然后转身就走。 面对空白的 PPT,你是不是也经常想把电脑砸了? 以前为了填这个坑,我得花几小时刷各种网站找素材。但最近,我摸到了 Google 的新神器 Mixboard。
昨天刷到了一条非常有意思的推特。
谁能想到,阿姆斯特朗那句“人类的一大步”,其实是在内华达州戈壁的一个人造布景中原地踏步。本报道中的所有照片均为2025年11月21日首次披露——内华达州,托诺帕——当74岁的埃利亚斯·索恩(Elias Thorne)终于决定开口时,他并没有选择忏悔,而是点燃了一支受潮的万宝路。
讲真,谁小时候没幻想过自己突然变成巨人? 像奥特曼那样,随手把高楼大厦当武器,亦或者,把珠穆朗玛峰当台阶一脚跨过去,《格列佛游记》里的小人国,更是想象已久的场景。
今日,美团正式发布并开源图像生成模型LongCat-Image,这是一款在图像编辑能力上达到开源SOTA水准的6B参数模型,重点瞄准文生图与单图编辑两大核心场景。在实际体验中,它在连续改图、风格变化和材质细节上表现较好,但在复杂排版场景下,中文文字渲染仍存在不稳定的情况。
豆包升级上新,火山引擎带着图像创作模型Doubao-Seedream-4.5来了。新模型有三个主打点。一是强化了原图保持能力,最大化保持原图的人脸、光影与色调、画面细节,可以用来P图。例如“只保留绿线中的人物,将其他角色都删掉”:
疯狂动物城2 前几天刚正式上映,超过哪吒,成为中国影史动画电影预售票房冠军,双休日买好票准备去看了吗。社交媒体上,早在预售的时候,就已经都是警官兔朱迪与狐尼克,出现在不同网友的电影院合影里。