AI资讯新闻榜单内容搜索-视频生成模型

多人有声视频一体化生成！用百度最新AI生成营销视频，现在1.4元/5秒

最初说不做视频生成模型的百度，现在在视频生成的路上一路狂奔！就在刚刚，百度蒸汽机（MuseSteamer）视频生成大模型升级至2.0版本，主打多人有声音视频一体化生成。

来自主题: AI资讯

10184 点击 2025-08-22 11:32

刚刚，好莱坞特效师展示AI生成的中文科幻大片，成本只有330元

多模态的生成，是 AI 未来的方向。最近，AI 领域的气氛正在发生微妙的变化。比如，刚刚推出了 Grok 4 的 xAI 却在重点宣传他们的视频生成模型 Grok Image。

来自主题: AI资讯

8446 点击 2025-08-22 09:19

上下文记忆力媲美Genie3，且问世更早：港大和可灵提出场景一致的交互式视频世界模型

要让视频生成模型真正成为模拟真实物理世界的「世界模型」，必须具备长时间生成并保留场景记忆的能力。然而，交互式长视频生成一直面临一个致命短板：缺乏稳定的场景记忆。镜头稍作移动再转回，眼前景物就可能「换了个世界」。

来自主题: AI技术研报

9395 点击 2025-08-21 11:25

6秒造一个「视频博主」，Pika让一切图片开口说话

制作一个视频需要几步？可以简单概括为：拍摄 + 配音 + 剪辑。还记得 veo3 发布时引起的轰动吗？「音画同步」功能的革命性直接把其他视频生成模型按在地上摩擦，拍摄 + 配音 + 粗剪一键搞定。

来自主题: AI资讯

9115 点击 2025-08-13 16:59

阿里开源电影级AI视频模型！MoE架构，5B版本消费级显卡可跑

电影级视频生成模型来了。

来自主题: AI资讯

11363 点击 2025-07-29 12:49

夸克、浙大开源OmniAvatar，一张图+一段音，就能生成长视频

近期，夸克技术团队和浙江大学联合开源了OmniAvatar，这是一个创新的音频驱动全身视频生成模型，只需要输入一张图片和一段音频，OmniAvatar即可生成相应视频，且显著提升了画面中人物的唇形同步细节和全身动作的流畅性。此外，还可通过提示词进一步精准控制人物姿势、情绪、场景等要素。

来自主题: AI资讯

9028 点击 2025-07-25 17:07

全在这里了，小白也可以一文读懂的“世界模型”

我们先来回顾一下近期相关事件： 6 月 18 日，Midjourney 发布首个 AI 视频生成模型 V1，标志其从静态图像创作向动态多媒体内容生产转型。V1 支持上传或用其他模型生成图像来生成视频片段，但有无法生成音频、时长限制等不足。Midjourney 透露长期目标是将多种技术融合为"世界模型"，使用户能在动态生成的虚拟环境中自由探索。

来自主题: AI资讯

10327 点击 2025-06-26 10:37