AI资讯新闻榜单内容搜索-文生图

又一国产图像大模型开源！实测连续P图绝了，中文渲染是短板

今日，美团正式发布并开源图像生成模型LongCat-Image，这是一款在图像编辑能力上达到开源SOTA水准的6B参数模型，重点瞄准文生图与单图编辑两大核心场景。在实际体验中，它在连续改图、风格变化和材质细节上表现较好，但在复杂排版场景下，中文文字渲染仍存在不稳定的情况。

来自主题: AI资讯

7355 点击 2025-12-08 19:51

继 Nano Banana 2 之后，国产 AI 生图又杀出「一致性标杆」，Vidu 生图限时无限免费

现在，终于也有国产 AI 接力，进一步把这条路跑通。Vidu Q2 最新上线的文生图、参考生图、图像编辑功能就是这个路子：卷完「好看」，它开始死磕「稳定性」。这次 Vidu Q2 直接把技能点全加在了「一致性」上。什么概念？就是把「人设崩坏」、「产品变形」、「画风突变」这些老大难问题统统按在地上摩擦。

来自主题: AI资讯

7402 点击 2025-12-01 16:13

6B文生图模型，上线即登顶抱抱脸

6B小模型，首日下载量高达50万次，上线不到两天直接把HuggingFace两个榜单都冲了个第一。

来自主题: AI技术研报

6563 点击 2025-12-01 15:13

Nano Banana Pro上线！集成Gemini 3与Veo 3，谷歌不给竞争对手喘息机会

谷歌乘胜追击！Gemini 3 Pro好评如潮没两天，最强文生图模型Nano Banana也推出Pro版本。

来自主题: AI资讯

7393 点击 2025-11-21 10:54

谁是AI之王？聊聊备受争议的AI评测与崛起的LMArena

当AI模型排行榜开始被各种刷分作弊之后，谁家大模型最牛这个问题就变得非常主观，直到一家线上排行榜诞生，它叫：LMArena。在文字、视觉、搜索、文生图、文生视频等不同的AI大模型细分领域，LMArena上每天都有上千场的实时对战，由普通用户来匿名投票选出哪一方的回答更好。

来自主题: AI资讯

7782 点击 2025-11-03 09:41

锁定角色，「多主体」也可控！个性化文生图，给你PS般交互体验

LayerComposer革新了个性化图像生成，让用户像在Photoshop里一样自由操控元素位置、大小，解决传统方法交互性与多主体扩展难题，实现更自然、高效的创作，推动个性化生成迈向主动交互新阶段。

来自主题: AI技术研报

8443 点击 2025-11-02 10:07

天下苦VAE久矣：阿里高德提出像素空间生成模型训练范式, 彻底告别VAE依赖

近年来，基于扩散模型的图像生成技术发展迅猛，催生了Stable Diffusion、Midjourney等一系列强大的文生图应用。然而，当前主流的训练范式普遍依赖一个核心组件——变分自编码器（VAE），这也带来了长久以来困扰研究者们的几个问题：

来自主题: AI技术研报

6063 点击 2025-10-30 17:03

谷歌最强AI，被港科大开源超了？让海外创作者喊出「King Bomb」的P图大杀器来了

两周前，港科大讲座教授、冯诺依曼研究院院长贾佳亚团队开源了他们的最新成果 DreamOmni2，专门针对当前多模态指令编辑与生成两大方向的短板进行了系统性优化与升级。该系统基于 FLUX-Kontext 训练，保留原有的指令编辑与文生图能力，并拓展出多参考图的生成编辑能力，给予了创作者更高的灵活性与可玩性。

来自主题: AI资讯

8475 点击 2025-10-23 16:26

刚刚，全球AI生图新王诞生！腾讯混元图像3.0登顶了

全球文生图大模型王座，易主了。就在刚刚，LMArena竞技场发布了最新的文生图榜单，第一名来自中国，属于腾讯混元图像3.0！不仅超越了谷歌的Nano Banana，也超越了字节的Seedream和OpenAI的gpt-Image，在全球26个大模型中稳居第一。

来自主题: AI资讯

9259 点击 2025-10-05 21:36

用两个简单模块实现分割理解双重SOTA！华科大白翔团队等推出多模态新框架

多模态大模型需要干的活，已经从最初的文生图，扩展到了像素级任务（图像分割）。

来自主题: AI技术研报

7337 点击 2025-10-03 14:40