AI资讯新闻榜单内容搜索-文生图

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 文生图
100+大模型综测结果出炉!智源发布FlagEval“百模”评测结果,覆盖文本语音图片视频多种模态

100+大模型综测结果出炉!智源发布FlagEval“百模”评测结果,覆盖文本语音图片视频多种模态

100+大模型综测结果出炉!智源发布FlagEval“百模”评测结果,覆盖文本语音图片视频多种模态

2024年12月19日,智源研究院发布并解读国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。

来自主题: AI资讯
7173 点击    2024-12-20 09:43
更懂中文还兼顾SD生态,360开源文生图模型结构,寡姐秒变中国新娘 | AAAI

更懂中文还兼顾SD生态,360开源文生图模型结构,寡姐秒变中国新娘 | AAAI

更懂中文还兼顾SD生态,360开源文生图模型结构,寡姐秒变中国新娘 | AAAI

具备原生中文理解能力,还兼容Stable Diffusion生态。 最新模型结构Bridge Diffusion Model来了。 与Dreambooth模型结合,它生成的穿中式婚礼礼服的歪国明星长这样。

来自主题: AI资讯
6400 点击    2024-12-19 10:08
让多视角图像生成更轻松!北航和VAST推出MV-Adapter

让多视角图像生成更轻松!北航和VAST推出MV-Adapter

让多视角图像生成更轻松!北航和VAST推出MV-Adapter

最近,2D/3D 内容创作、世界模型(World Models)似乎成为 AI 领域的热门关键词。作为计算机视觉的基础任务之一,多视角图像生成是上述热点方向的技术基础,在 3D 场景生成、虚拟现实、具身感知与仿真、自动驾驶等领域展现了广泛的应用潜力。

来自主题: AI技术研报
6910 点击    2024-12-18 14:31
一手实测豆包新发布的视觉理解大模型,他们真的卷起飞了。

一手实测豆包新发布的视觉理解大模型,他们真的卷起飞了。

一手实测豆包新发布的视觉理解大模型,他们真的卷起飞了。

人在字节火山发布会现场。 眼睁睁看着他们发了一大堆的模型升级,眼花缭乱,有一种要一股脑把字节系的AI底牌往桌上亮的感觉。 有语音的,有音乐的,有大语言模型的,有文生图的,有3D生成。

来自主题: AI资讯
6928 点击    2024-12-18 14:17
豆包生成汉字,不是神秘的技术,而是好产品

豆包生成汉字,不是神秘的技术,而是好产品

豆包生成汉字,不是神秘的技术,而是好产品

12月初,豆包和即梦在移动端悄然上线了一项新功能:能够生成带有工整中文字体的图片。一时间,朋友圈被各种AI制作的四格漫画、产品海报、电影海报刷屏。

来自主题: AI资讯
7960 点击    2024-12-16 14:50
好消息,我们有中国人自己的Recraft和Midjourney了!

好消息,我们有中国人自己的Recraft和Midjourney了!

好消息,我们有中国人自己的Recraft和Midjourney了!

你现在不需要Recraft和Midjourney了,用咱国产的星流吧,效果一点都不差!今天有个佬给我丢了个链接,说是一个效果对标Midjourneyv6.1和Recraft的文生图产品 然后还给我丢了张图,说是用我的身材和名字生成的

来自主题: AI资讯
7166 点击    2024-12-11 22:53
Grok祭出首款生图模型Aurora!两位95后华人立大功,耗时6月自研MoE

Grok祭出首款生图模型Aurora!两位95后华人立大功,耗时6月自研MoE

Grok祭出首款生图模型Aurora!两位95后华人立大功,耗时6月自研MoE

消失一天后的Aurora,正式上线了。一大早,马斯克官宣了Grok集成了自研图像新模型Aurora,MoE架构自回归模型,直接将生成编辑能力一统。在人物肖像生成上,已经逼真到肉眼无法辨别。

来自主题: AI技术研报
5178 点击    2024-12-10 16:22
讲清楚了!一文讲透扩散模型

讲清楚了!一文讲透扩散模型

讲清楚了!一文讲透扩散模型

昨天,为大家介绍了生成式对抗网络GAN,今天再来为大家介绍另一个有趣的模型:扩散模型,包括Stability AI、OpenAI、Google Brain在内的多个研究团队基于扩散模型提出了多种创新模型,如以文生图、图像生成视频生成等~

来自主题: AI技术研报
7321 点击    2024-12-03 14:53