AI资讯新闻榜单内容搜索-图像生成

又一国产模型黑马出世，追平Gemini 2.5 Pro，空间编辑反超视频模型？

近日，京东开源图像模型JoyAI-Image-Edit，将空间智能纳入图像理解与编辑，让AI开始处理真实世界中的空间关系，让模型真正“理解空间，编辑空间”。简单解释，这是一个以空间智能为核心的图像生成与编辑模型，让 AI 真正“看懂”三维空间，从而让生成更合理、编辑更精准。

来自主题: AI资讯

9216 点击 2026-04-10 21:09

告别直接生成，文生图进入Agent时代：港中文联合伯克利开源Gen-Searcher

过去两年，图像生成模型在质感和审美上一路狂飙，但大多仍是 “直接出图” 的范式。

来自主题: AI技术研报

6896 点击 2026-04-10 08:34

跨物体融合新突破！从拼贴到创造：AI学会「生」出新物体

AI不再只是把两个物体「放一起」，而是真正造出一个新实体。VMDiff模型通过分阶段策略：先拼接保留信息，再插值融合成整体，并自动调节平衡，让生成结果既像两者，又自然统一。过去，很多图像生成模型都能同时画出两个物体；但要让它们真正「长成一个新物体」，其实远没有那么简单。

来自主题: AI技术研报

8753 点击 2026-04-04 10:58

这是一个划时代的生图模型，一手实测Wan2.7-Image

3月30日，阿里巴巴内部发布了 Wan2.7-Image 图像生成与编辑统一模型。根据官方公布的数据，在人类偏好盲测评分中，Wan2.7-Image 目前位列国内第一。从放出的评测雷达图来看，无论是文本生图（Text-to-Image）还是综合图像编辑（Image Editing），它的各项指标基本都盖过了市面上主流的几家头部模型。

来自主题: AI资讯

9322 点击 2026-04-02 10:42

前端大神Cheng Lou新项目火了！支持AI助手一键接入

Cheng Lou：React 核心团队成员，参与 ReactJS 的早期开发；主导了 ReasonML（后来演变为 ReScript）的开发；目前在 Midjourney 工作，参与 AI 图像生成平台的开发。

来自主题: AI资讯

8494 点击 2026-03-30 15:32

清华、西交联合开源发布了Cheers : 一条更简洁、更高效的统一多模态路线

过去几年，多模态模型在理解任务上快速演进，图像问答、OCR、视觉推理、跨模态对话等能力不断提升；与此同时，图像生成模型也在视觉质量、指令遵循和细节表达上持续突破。下一步一个自然的问题是：能否用同一个模型，同时做好理解与生成？这正是统一多模态模型（Unified Multimodal Models, UMMs）正在回答的问题。

来自主题: AI技术研报

7492 点击 2026-03-26 14:45

5B参数+4060Ti，10秒出图，全流程开源可复现！补齐统一多模态生成编辑的开源版图，让高质量图像生成真正变得更轻量、更普及

统一多模态生成编辑模型，正在走向“重器化”

来自主题: AI技术研报

10491 点击 2026-03-18 16:15

李飞飞团队新作：简单调整生成顺序，大幅提升像素级图像生成质量

但扩散模型生图，顺序真的对吗？李飞飞团队最新论文提出的Latent Forcing方法直接打破了这一共识，他们发现生成的质量瓶颈不在架构，而在顺序。

来自主题: AI技术研报

9179 点击 2026-02-15 21:27

字节发完阿里发！Qwen-Image 2.0火线出击

今天，阿里巴巴发布了新一代图像生成基础模型Qwen-Image 2.0，这一模型支持长达一千个token的超长指令、2k分辨率，并采用了更轻量的模型架构，模型尺寸远小于Qwen-Image 2.0的20B，带来更快的推理速度。

来自主题: AI资讯

10389 点击 2026-02-10 18:48

刚刚，Seedream 5.0上线！字节又一新模型

新模型对标Nano Banana Pro，能免费体验。Seedance 2.0的热度还没下去，字节新模型又来了！今日，字节图像生成模型Seedream 5.0 Preview在视频编辑应用剪映、剪映海外版Capcut、字节AI创作平台小云雀均已上线，在即梦AI平台开启灰度测试，图片生成可限时免费体验。

来自主题: AI资讯

8749 点击 2026-02-10 14:38