
究竟该指望谁来拉近我们与AI的距离?
究竟该指望谁来拉近我们与AI的距离?AI被所有人使用的时代,正越来越近。如果说AI大模型之前已经用ChatGPT多轮的技术进展、国内的百模大战、Sora在视频大模型领域的突破,以及其他一系列大模型初步的应用探索证明了全新的AI更强大;那么最近悄然吹起的、厂商纷纷将最日常使用的消费电子终端套上AI之名的占位之风,则进一步宣告了AI普惠时代的加速到来。
AI被所有人使用的时代,正越来越近。如果说AI大模型之前已经用ChatGPT多轮的技术进展、国内的百模大战、Sora在视频大模型领域的突破,以及其他一系列大模型初步的应用探索证明了全新的AI更强大;那么最近悄然吹起的、厂商纷纷将最日常使用的消费电子终端套上AI之名的占位之风,则进一步宣告了AI普惠时代的加速到来。
Sora,OpenAI的人工智能AI生成式视频大模型,在2024年2月15日一经发布,就引发了全球关注,硅谷AI视频论文作者(非Sora)这样评价:相当好,这是毋庸置疑的No.1。
最近一份美国市场研究机构发布的报告火了。报告详细分析了OpenAI部署Sora所需的硬件资源,计算得出,在峰值时期Sora需要高达72万张英伟达H100 来支持,对应成本是1561亿人民币。
在上个月推出视频生成模型 Sora 后,就在昨天,OpenAI 又发布了一系列创意工作者借助 Sora 进行的创作,效果极为惊艳。毫无疑问,就生成质量,Sora 是迄今为止最强的视频生成模型,它的出现不仅会直接对创意行业带来冲击,也会影响对机器人、自动驾驶领域的一些关键问题的解决。
扩散模型凭借其在图像生成方面的出色表现,开启了生成式模型的新纪元。诸如 Stable Diffusion,DALLE,Imagen,SORA 等大模型如雨后春笋般涌现,进一步丰富了生成式 AI 的应用前景。然而,当前的扩散模型在理论上并非完美,鲜有研究关注到采样时间端点处未定义的奇点问题。此外,奇点问题在应用中导致的平均灰度等影响生成图像质量的问题也一直未得到解决。
Sora问世后,AI的话题声浪愈发高涨。 在舆论场上,“AI复活”已故明星遭到了家属和众多网友的抵制;国际时事中,英国凯特王妃的发声视频被质疑为AI所为,欧盟的《人工智能法案》已进入立法的最后阶段;互联网领域,字节跳动的AI新部门Flow推出AI社交APP“话炉”,加码探索AI赛道。
随着 Sora 的成功发布,视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [1] 的成功为图像生成的规模化提供了可能性。
王炸Sora发布后,想要分辨AI视频和真实视频变得更难了,各行各业都面临新的挑战与危机。
这一波大模型产业落地浪潮里,不少企业其实处在 “干瞪眼“的状态。一种情况是,很多大模型产品看得见却摸不着,在台上一个个遥遥领先——今天Sora技精四座,明天英伟达的机器人又赢得满堂彩,可是到了台下一问:啥时候能用上啊?答曰:遥遥无期。
2024年2月,OpenAI发布其首款视频生成模型Sora,用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频,与一年前的AI生成视频相比,在各维度均实现了质的提升。