小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统
8819点击    2025-12-18 13:07

谷歌丢出Gemini 3 Flash,给AI圈示范了啥叫:小孩子才做选择题,成年人当然是全都要(doge)。


一个公式来形容这款新模型:Gemini 3 Flash=Pro级智能+Flash级速度+更低价格


比速度,它几乎是Gemini 2.5 Pro的3倍,实测更是丝滑到起飞:


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


比智能,它更是在多个经典测试中,战胜了包括Gemini 3 Pro、GPT5.2在内的一众顶尖模型。


数图中有多少根手指,GPT5.2张口就来“5根”,而Gemini 3 Flash成功识破陷阱并给出正确答案“6根”。


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


画一张骑车的鹈鹕,Gemini 3 Flash(右上)的表现明显优于Gemini 2.5 Pro(左)和Gemini 3 Pro(右下),而且这些还都是反复测试后抽取的最佳结果。


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


考察眼力环节,看模型们是否认识“谷歌宣传委员”Logan kilpatrick。


Gemini 3 Flash率先答对,而Gemini 3 Pro将他误认为Gemini前负责人Jack Krawczyk(已于今年4月离职并转投Meta)


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


在更多测试中,Gemini 3 Flash都展示出自己不俗的综合实力。


虽然叫“Flash”,但其实是谷歌迄今最强智能体模型


敲黑板,这款模型即日起已面向全球所有用户推出


普通用户可通过Gemini应用以及谷歌搜索的AI模式使用;专业开发者可在Google AI Studio、Gemini CLI以及谷歌全新的智能体开发平台Google Antigravity中,通过Gemini API进行调用和集成。


同时,企业客户也可通过Vertex AI和Gemini Enterprise两大平台获取其服务。


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


整体而言,Gemini 3 Flash还是继承了Gemini 3 Pro的复杂推理能力、多模态和视觉理解能力、Vibe编程能力,以及处理智能体任务的能力,只不过响应速度更快。


谷歌官方表示,这是他们迄今为止“在智能体工作流程方面最出色的模型”。


话不多说,我们这就看看Gemini 3 Flash能做什么以及实际表现如何?


比如让它创建一个功能完整、美观的Windows操作系统,核心环节几乎用时不到一分钟(视频未加速)

小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


分享该测试的网友表示,“这是一款令人叹为观止的模型”。


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


还能用来直接生成游戏,网友所使用的提示词如下:


用代码为我创建一个《侠盗猎车手6》游戏,并尽可能使其逼真,添加您选择的任何功能。

小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


游戏的感觉有了,只不过画面仍有一定提升空间。


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


不过如果换成一些难度稍低一点的小游戏,效果倒还不错。

小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


而用它来生成一张天气卡的效果be like:


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


肉眼可见设计更高级,并且交互效果更丰富。


最后我们简单上手实测一下,让它给自己生成一个介绍网站。

小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


经过实测,网站上面的测速功能可以正常使用,不只是个空有前端的“花架子”:


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


而且点击“立即体验”按钮后,也确实能跳转到Gemini的官网网页。


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


这波看下来,你觉得Gemini 3 Flash表现如何?


性能速度双双超越2.5 Pro,价格却低得多


此外,官方测评显示,Gemini 3 Flash主打一个“加速不降智”


性能上不仅显著超越Gemini 2.5 Pro,而且在专业多模态测试MMMU Pro、复杂推理测试ARC-AGI-2等方面,还能略胜Gemini 3 Pro。


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


更重要的是,它还在性能、成本和速度方面突破了帕累托极限——速度比Gemini 2.5 Pro快3倍,平均使用的token数量却少30%


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


价格方面,Gemini 3 Flash相比前几代模型更具性价比。


其每百万输入token为0.5美元,每百万输出token为3美元(音频输入价格仍为每百万输入token 1美元)


虽然略贵于Gemini 2.5 Flash(每百万输入0.3美元/每百万输出2.5美元),但考虑到其性能和速度,这一价格仍然相当具有吸引力。


(Gemini 2.5 Pro价格为,每百万输入1.25美元/每百万输出10美元。)


至此,谷歌Gemini 3算是集齐了全部家族成员,包括之前的Pro和Deep Think深度思考版。


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


而且说到思考模式,根据开发者文档,这次的Gemini 3 Flash一共有四档思考模式——minimal、low、medium、high


只需看一眼图片效果演进,你就知道这几档的区别了(doge):


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


One More Thing


有意思的是,Gemini 3 Flash发布后,谷歌这边还立马开了一个《宝可梦:水晶版》的直播。


两位对战选手分别是Gemini 3 Flash和Gemini 3 Pro


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


虽然最终结果还没有出来,但初步来看Gemini 3 Pro暂处于领先地位。


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


有网友还惊喜发现,Gemini 3 Pro在游戏中似乎已经展现出某种系统级思考能力


小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统


感兴趣的童鞋也可以蹲一波结果了~以及坐等一个反转。


参考链接:

[1]https://x.com/OfficialLoganK/status/2001428651121025391?s=20

[2]https://x.com/simonw/status/2001424152763470238?s=2

[3]https://blog.google/products/gemini/gemini-3-flash/


文章来自于微信公众号 “量子位”,作者 “量子位”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

5
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales