扩散模型更懂复杂提示词!Pika北大斯坦福开源新框架,利用LLM提升理解力
扩散模型更懂复杂提示词!Pika北大斯坦福开源新框架,利用LLM提升理解力Pika北大斯坦福联手,开源最新文本-图像生成/编辑框架!
Pika北大斯坦福联手,开源最新文本-图像生成/编辑框架!
AI 视频生成,是最近最热门的领域之一。各个高校实验室、互联网巨头 AI Lab、创业公司纷纷加入了 AI 视频生成的赛道。Pika、Gen-2、Show-1、VideoCrafter、ModelScope、SEINE、LaVie、VideoLDM 等视频生成模型的发布,更是让人眼前一亮。
Stable Diffusion要王者归来了?
字节跳动联合中科院自动化研究所提出新方法,用AI快速检测出视频中的高光片段,对输入视频的长度以及期望提取的高光长度都具有极高的灵活性,相关论文已被AAAI 2024收录。
2023年一月份,还没有公开的文本转视频模型。截至目前,AI视频生成产品已达数十种,用户数百万。回顾这一年的AI生成式视频发展+值得关注的技术及应用,我们一起聊聊相关内容。
Gen-2“运动笔刷”(Motion Brush)官宣再进化!它现在的名叫“多头运动笔刷”(Multi Motion Brush),敲重点:“加量不加价”所有用户包含免费账户都能体验。
生成式AI这把火在资本市场越烧越旺。根据智东西统计,2023年新晋的生成式AI和大模型领域相关独角兽达23家,国内新晋独角兽有6家,分别是智谱AI、MiniMax、百川智能、零一万物、智元机器人,以及已被收购的光年之外。这些独角兽企业涉及大语言模型、AI视频生成、垂直行业应用研发商以及GPU云服务提供商。
这个行当里,目前不用AI不会被替代,但注定会被时代抛下
是字节最新的AI视频生成模型MagicVideo-V2,各种奇思妙想的想法都能实现。它不仅支持4K、8K超高分辨率,轻松hold各种绘图风格。
在 AI 领域,近年来各个子领域都逐渐向 transformer 架构靠拢,只有文生图和文生视频一直以 diffusion + u-net 结构作为主流方向。diffusion 有更公开可用的开源模型,消耗的计算资源也更少。