谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对
6686点击    2026-05-12 15:21

今天,谷歌原生视频模型Gemini Omni意外曝光!各种惊艳demo刷爆,教授黑板推导数学公式、一句话编辑视频,丝滑程度让全网破防。


谷歌I/O大会开幕在即,原生Gemini提前曝光!


如今,全网都被这个视频刷爆了——


一位教授在台上一边讲课,一边在黑板上随手推导公式,这质感、丝滑度,堪称惊艳。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


实际上,这是由「全新视频模型」Gemini Omni生成,连贯性、一致性直接拉满。


有网友惊叹道,视频版Nano Banana来了!


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


还有人表示,眼见为实已经不存在了。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


原生Gemini Omni,首次曝光了


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


就在昨天,Gemini移动端App主页截图流出,一个全新视频模型Gemini Omni入口上线。


界面中,赫然写着——


快来认识一下我们全新的视频生成模型。重新混剪你的视频,直接在对话中编辑,尝试模板。


显然,谷歌以全新形式带来了Gemini Omni!


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


这可能是一个全模态的Gemini,同时支持文本、图像、音频、视频输入和输出。


与Veo不同的是,Omni将像Nano Banana一样深度集成到Gemini中,具备更出色的提示理解与推理能力。


尤其是,在实时视频编辑上,可以一键物体替换,去除水印。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


与此同时,Omni模型的ID也被同时爆出——


fbard_eac_video_generation_omni /bard/v3smm-lora-prod.goat-cr-rev6-xm171555416-at-1200


可见,Omni生成的视频支持10s时长,分辨率1280x720。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


真正让全网陷入疯狂的是,几个提前测试放出的demo。


教授黑板推公式,全网震惊


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


最炸裂的那个一,便是开篇「教授在黑板上推导三角恒等式」的视频。


画面中,教授手持粉笔在黑板上一步一步写下数学证明,同时用口语同步讲解当前推导步骤。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


懂行的人看到这会直接跳起来。在AI生成视频里把数学公式写对,这件事有多难?


文本一致性一直是视频生成模型的「阿喀琉斯之踵」。


此前,Sora生成的文字经常是看着像字,但仔细一看全是「鬼画符」的状态,更别提完整的数学推导了。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


而Omni的这段demo,公式是对的,推导是连贯的,笔迹是自然的。


更难以想象的是,这个惊艳的demo,仅用了一句提示词——


A professor writes out a mathematical proof for trigonometric identities on a traditional chalkboard, explaining the step he is currently on in the equation.


许多人看完,直接破防!


不得不说,AI视频生成已跨越「恐怖谷」,正式进入超写实时代。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


还有灰度到的网友,也做了一批类似的视频,个个都好到爆。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


真正的杀手锏:实时编辑


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


Gemini Omni强大之处不止于生成,这一次,「实时编辑」也实现了大幅跨越。


泄露的演示中,Omni展现了令人瞠目的编辑能力——


  • 一键去水印:Omni可以直接对话去水印,且画面毫无破绽;


  • 物体替换: 动动嘴,视频中的物体就被精准替换,光影、遮挡关系全部自动适配;


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


如下demo中,上面是原视频,仅需一句话把意大利面换成「奶油浓汤」,瞬间完成。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


再比如,上传一个Sora之前生成的视频,Gemini Omni可以直接去除水印。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


有人对此表示,仅是去水印这一点,足以让这一工具成为创作者的游戏规则改变者。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


不仅如此,Gemini Omni还可以支持风格化输出。


下面这个动漫风格的视频,蓝色火焰特效、打斗动作线条,每一帧都像是专业动画师手绘的。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


不过早期测试显示,Gemini Omni额度消耗非常快。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


谷歌杀回,Sora 2却关停了


Gemini Omni泄露的时间点,堪称「精准卡位」。


就在两周前——4月26日,OpenAI的Sora App正式停服。


这个曾经让全世界为之疯狂的AI视频生成器,走完了它短暂而戏剧化的一生。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


回顾一下Sora的死因,简直是一部商业悲剧:


烧钱速度惊人,据称,Sora的推理成本高达每天100万到1500万美元。视频生成比文本和图像生成贵了不止一个量级,而这个成本始终没降下来。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


最关键的是,OpenAI留不住用户。峰值约100万活跃用户,到停服前已跌破50万,30天留存率不到8%。


整个生命周期的应用内收入仅约210万美元,连一天的算力费都覆盖不了。


3月24日,Sora官方账号在X上发出那句著名的告别,「We're saying goodbye to the Sora app」。


API将在9月24日彻底关闭,一个时代结束了。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


谷歌I/O 2026将在5月19日开幕,Gemini Omni极有可能在主舞台上正式亮相。


AI视频赛道,又要变天了。


有网友将Omni生成的视频,和Sora 2做了一个直观对比,效果简直差出好几个量级。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


动漫打斗场景中,Gemini Omini丝滑到炸裂,Sora特效却一团乱麻。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


I/O倒计时,谷歌摊牌


除了Omni,谷歌多款尚未正式发布的Gemini「全线模型」被意外推送到生产环境API中。


此次泄露的模型阵容极其豪华,包括Gemini 3 Flash、3.1全系列(Pro、Flash Image、Lite、TTS),以及专注于高保真音频生成的Lyria 3 Pro。


最重磅的是,谷歌即将推出的「Omni」原生多模态视频模型,将针对所有的核心模型推出专门的Agent版本。


谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对


I/O主舞台,谷歌要摊牌了!


参考资料:

https://x.com/chetaslua/status/2053824398503678108?s=20

https://x.com/testingcatalog/status/2053857806374064496?s=20

https://x.com/Waguri_Kaoruko8/status/2053818116237353039?s=20

https://www.reddit.com/r/singularity/comments/1ta99ss/upcoming_leaked_gemini_omni_vs_nearly_shutting/


文章来自于"新智元",作者 "桃子 好困"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales