全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重
全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重全球首个开源的类Sora架构视频生成模型,来了!
搜索
全球首个开源的类Sora架构视频生成模型,来了!
都说今年是大模型落地元年,但实际进展还是快得超出想象了。
马斯克说到做到: 旗下大模型Grok现已开源
继2月以投后约25亿美金估值炸场后,杨植麟的大模型公司月之暗面终于有了一次公开对媒体的活动。
深度学习模型因其能够从大量数据中学习潜在关系的能力而「彻底改变了科学研究领域」。然而,纯粹依赖数据驱动的模型逐渐暴露出其局限性,如过度依赖数据、泛化能力受限以及与物理现实的一致性问题。
年 5 月,动动鼠标就能让图片变「活」得研究 DragGAN 吸引了 AI 圈的关注。通过拖拽,我们可以改变并合成自己想要的图像,比如下图中让一头狮子转头并张嘴!
Fast-DetectGPT 同时做到了高准确率、高速度、低成本、通用,扫清了实际应用的障碍!
说到做到,马斯克承诺的开源版大模型 Grok 终于来了!
不久前 OpenAI Sora 以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦点。继 2 周前推出成本直降 46% 的 Sora 训练推理复现流程后,Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模型 「Open-Sora 1.0」,涵盖了整个训练流程,包括数据处理、所有训练细节和模型权重,携手全球 AI 热爱者共同推进视频创作的新纪元。
本文编译自播客节目a16z。Stability AI的科学家Andreas Blattmann和Robin Rombach与a16z的合伙人Anjney Midha共同探讨从文本到视频人工智能的前沿世界。