AI资讯新闻榜单内容搜索-生成模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 生成模型
英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命

英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命

英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命

Nvidia刚刚发布了「世界生成」模型Cosmos-Transfer1,可以根据多种模态的空间控制输入(如分割、深度和边缘)生成世界模拟,使得世界生成具有高度可控性。开发者使用模型能够创建高度逼真的模拟环境,用于训练机器人和自动驾驶车辆。

来自主题: AI技术研报
7698 点击    2025-03-22 10:56
Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

澳大利亚国立大学团队提出了ARINAR模型,与何凯明团队此前提出的分形生成模型类似,采用双层自回归结构逐特征生成图像,显著提升了生成质量和速度,性能超越了FractalMAR模型,论文和代码已公开。

来自主题: AI技术研报
6762 点击    2025-03-22 10:50
华为诺亚综述:生成式模型如何用于决策?

华为诺亚综述:生成式模型如何用于决策?

华为诺亚综述:生成式模型如何用于决策?

近年来,生成模型在内容生成(AIGC)领域蓬勃发展,同时也逐渐引起了在智能决策中的应用关注。

来自主题: AI技术研报
7856 点击    2025-03-20 16:38
无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

文本到图像(Text-to-Image, T2I)生成任务近年来取得了飞速进展,其中以扩散模型(如 Stable Diffusion、DiT 等)和自回归(AR)模型为代表的方法取得了显著成果。然而,这些主流的生成模型通常依赖于超大规模的数据集和巨大的参数量,导致计算成本高昂、落地困难,难以高效地应用于实际生产环境。

来自主题: AI技术研报
5894 点击    2025-03-20 09:18
马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型

马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型

马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型

马斯克也要打造自己的视频生成模型了??就在最近,xAI收购了一家视频生成初创公司,这家仅4个人的公司过去两年打造出了Hotshot这款产品。Hotshot至今已有3款视频生成基础模型。被收购之后,目前已停止推出新的视频创作功能,而且用户过往创作的视频截止下载时间为3月30日。

来自主题: AI资讯
8930 点击    2025-03-18 21:17
速递|Moonvalley 发布了一款视频生成器,声称其基于授权内容训练

速递|Moonvalley 发布了一款视频生成器,声称其基于授权内容训练

速递|Moonvalley 发布了一款视频生成器,声称其基于授权内容训练

洛杉矶初创公司 Moonvalley 推出了一款 AI 视频生成模型,该公司声称这是少数基于公开许可(非版权)数据训练的模型之一。

来自主题: AI资讯
5946 点击    2025-03-13 15:24
10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜一

10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜一

10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜一

DiffRhythm是一款新型AI音乐生成模型,能在10秒内生成长达4分45秒的完整歌曲,包含人声和伴奏。它采用简单高效的全diffusion架构,仅需歌词和风格提示即可创作,还支持本地部署,最低只需8G显存。

来自主题: AI技术研报
3798 点击    2025-03-12 15:59
无需训练让扩散模型提速2倍,上交大提出Token级缓存方案|ICLR‘25

无需训练让扩散模型提速2倍,上交大提出Token级缓存方案|ICLR‘25

无需训练让扩散模型提速2倍,上交大提出Token级缓存方案|ICLR‘25

Diffusion Transformer模型模型通过token粒度的缓存方法,实现了图像和视频生成模型上无需训练的两倍以上的加速。

来自主题: AI技术研报
5999 点击    2025-02-28 15:06
用完Claude 3.7,我感觉程序员在加速贬值

用完Claude 3.7,我感觉程序员在加速贬值

用完Claude 3.7,我感觉程序员在加速贬值

昨天,Claude 3.7 Sonnet 正式发布。根据目前的各项测评,这个模型可以说是全宇宙最好的代码生成模型,超越了 DeepSeek R1 和 OpenAI 的 o3 等模型。如果你是程序员,一定要第一时间切换过去,用下这款模型。

来自主题: AI资讯
5931 点击    2025-02-27 09:54
何恺明ResNet级神作,分形生成模型计算效率狂飙4000倍!清华校友一作

何恺明ResNet级神作,分形生成模型计算效率狂飙4000倍!清华校友一作

何恺明ResNet级神作,分形生成模型计算效率狂飙4000倍!清华校友一作

大自然的分形之美,蕴藏着宇宙的设计规则。刚刚,何恺明团队祭出「分形生成模型」,首次实现高分辨率逐像素建模,让计算效率飙升4000倍,开辟AI图像生成新范式。

来自主题: AI技术研报
9186 点击    2025-02-26 15:17