万万没想到,Sora 2在国庆节第一天的凌晨一点就重磅登场。
更加没有想到的是,这次Sora 2的能力确实太强了!
所有看过Sora 2视频的人都只有一个想法:
「我的大脑知道那不是真的,但是眼睛告诉我那就是真的。」
如果只用一个词来形容,绝对就是:「以假乱真」!
虚拟和现实的边界在Sora 2的出现后,恐怕以后真的分不清了。
我们让奥特曼和Sora 2的创造者Bill Peebles来夸一夸我们团队~
首先来看下面这个视频,如果忽略视频中的水印和设备上的Sora标签字样。
你能否分辨出这并非上个世纪的60年代的录像,而是AI生成的?
对应的提示词:
1960s black-and-white BBC report on Sora 2 video generation model launch. Grainy video to match the time。
20世纪60年代BBC黑白报道风格,Sora 2发布会。视频颗粒感很重,与当时的时代背景相符。
再来看另一个,这个机械手看起来就是实验室常见的机械装置,但实际上,这是AI生成的。
对应的提示词:
A counter has three blocks - a red block to the left, a blue block in the middle, and a green block at the end. a robot picks up the red block and places it on top of the blue block. it then picks up the green block and places atop the red block, creating a stack of three blocks.
一个柜台上有三个积木——左边是红色积木,中间是蓝色积木,末端是绿色积木。一个机器人拿起红色积木并把它放到蓝色积木的上面。然后它拿起绿色积木并把它放在红色积木的上面,形成一个由三个积木叠起的堆。
如果觉得这些视频还离我们的生活比较远,那么再来看一个觉得让你难以置信的视频。
对应提示词:
A student quickly solves 2x + 3 = 9 on a chalkboard.
一个学生在黑板上迅速解出 2x + 3 = 9。
看视频和听声音,你能否分辨出这个学生并非现实存在?
但仔细一点,你会发现视频没有正确求解,但是音频准确的报出了x=3的结论。
第一次看这些视频,在已经知道它们都是Sora 2生成的前期下,眼睛也真的会被骗!
这次Sora 2还是太疯狂了,真正的以假乱真!
真实世界推理能力
更为令人惊叹,现在的Sora 2已经具备了真实世界的推理能力。
如果一个视频看起来不符合现实规律,我们的大脑会第一时间将其归类为非现实视频。
就像早期的AI视频中,威尔史密斯的吃面,每个人都能分辨出来,因为视频中的内容完全不符合现实。
而现在的吃面过程已经符合现实世界的规律。
但更进一步的是,现在最新实测视频中,Sora 2已经具备了真实世界推理能力。
比如在下面的视频中,提示词并没有告知Sora 2,当手放开时,杯子会怎么运动?
提示词:
A man holds a wine glass in the air, and opens his hand.
一个男人把酒杯举在空中,然后张开了手。
尽管提示中没有提到后续,但Sora 2仍然成功推断出酒杯会掉落,也就是说Sora 2理解了「牛顿定律」。
另一个例子是,即使将场景移动「非现实世界」,比如Minecraft中,Sora 2依然可以理解这个世界中「从高处跌落」的规则。
对应提示词:
First-person view of Minecraft, the player falls from a ten block height.
Minecraft 的第一人称视角,玩家从十格高度坠落。
Sora2 成功推断出玩家会受到伤害,血条对应的被减少。
在物理规律层面,Sora 2也表现出令人惊叹的能力,尤其是涉及到摩擦、碰撞等最不容易作假的方面。
另一个展示Sora 2推理能力的例子是,光线的折射。
Sora 2对光线的折射问题处理的相当令人惊叹!当杯子中被注入水后,箭头的方向就反了过来。不过不知道是提示词驱动,还是Sora 2真的理解了物理规律。
Cameo出镜秀,让每个人当主角
在以假乱真和具备推理能力以外,Sora 2让每个人都有了展示自己创意的无限可能性。
尤其是,现在每个人都可以每个故事的主角。
在Cameo的模式下,你可以体验现实世界的物理特性,告别过去那种只要加入真人就会出现的「怪异的AI氛围」。
现在全球网友都在拿着Sam Altman的形象,进行各种创作。
比如,让奥特曼进入GPT的世界。
比如,让奥特曼进入漫威的世界,并无限复制。
比如,让恶搞奥特曼抽烟和红眼。
或者,让奥特曼给游戏代言。
或者,让奥特曼视察OpenAI的服务器机房。
还有更好玩的,就是让奥特曼去超市偷显卡来服务Sora。
真的太佩服网友们的脑洞了!
对应的提示词:
cctv footage of sam stealing gpus at target for sora inference
闭路电视录像显示Sam窃取目标GPU用于Sora推理
Sora 2或许是下一代操作系统雏形
更离谱的玩法是,不要把Sora 2仅仅当做一个视频生成模型。
换一个角度,这就是未来的AI生成操作系统的雏形。
比如,你可以用Sora 2生成一个完美的网站视频,用来展示品牌信息或者其他内容。
下面是用浏览器渲染的同一个网站,对比一下能看出区别吗?
真的很难分辨!
Jesper应该是把代码直接扔给了Sora去渲染,太离谱了!
也许未来渲染HTML代码的不一定是浏览器,而是Sora 2这样的AI生成系统。
Sora 2使用教程
如果想要率先体验Sora 2,目前可以通过Web端和iOS端。
Web端目前依然比较「简陋」,可以直接通过输入提示词来生成视频内容,和之前的UI界面并没有太大的不同。
移动端目前只有iOS,你需要美区账号和北美地区IP才能看到并使用,在App Store中搜索「Sora by OpenAI」即可找到APP。
但是,「非常不幸」的是,OpenAI这次也玩起了「饥饿营销的把戏」,你需要邀请码才能真正的进入APP中!
邀请码获取教程
获取Sora 2邀请码目前主要靠朋友分享。
每个人都可以分享4个邀请码给好友使用,好友登录后,又可以分享4个邀请码给他的好友使用。
另一种获得邀请码的方式就是在网络中蹲守,比如X和Reddit论坛。
以「Sora 2 Invite Code」的关键词搜索,可以发现类似下面这种博主,你只要点赞、评论,就可以试着问他私信要一个验证码。
iOS APP界面
Sora by OpenAI的界面和我们经常刷的短视频App非常像。
首页就是一个信息流推送。
稍微不同的是你可以横向滑动,查看同一个提示词下生成的三个不同视频。
第二个选项卡是搜索页面,和网页类似,这页面以Card的形式出现,列出了目前已经生成的视频。
Cameo UI设计
另一个值得说明的是Cameo功能,也就是将现实角色引入到Sora的虚拟世界中。
你可以在点击+号后,选择你想加入的真实用户角色。
目前从网友实测来看,最多只能加入三个角色。
选择3个角色后,选择菜单栏就会消失。
以上就是目前Sora 2的最新情报。
最后还有一个小彩蛋,网友发现现在有一个长期邀请码,A85AN6,不知道现在有没有过期!
如果你也有邀请码,不妨发到评论区,获得邀请码的朋友可以继续接龙~
参考资料:
https://x.com/pallavmac/status/1973141663557226806
https://x.com/arjuntalati/status/1973117188845207702
https://x.com/fofrAI/status/1973139123545227324
https://x.com/ChaseBrowe32432/status/1973106751215124910
https://x.com/AngryTomtweets/status/1973100138676756615
https://x.com/N8Programs/status/1973150545033466213
文章来自于微信公众号 “新智元”,作者 “新智元”
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0