还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

9805点击 2025-11-28 10:41

Gemini 3 发布之后这些日子里，我逐渐感到疑惑：为什么总让 AI 写网站写 PPT，Gemini 都发到第三代了，不能干点更有意思的事吗？

要那种科幻感强的、效果酷炫的、难度系数高的，但小白也能做的。比如这种：

或者这种：

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

Gemini：手势交互？没问题，包的。

在开始之前，先准备好 Gemini 3，这里是一点点的注意事项👇🏻

目前有三种方式开启玩耍：Gemini 客户端 Canvas 模式、Google AI studio-Playground 和 Google AI studio-Build。

其中，最不推荐的是客户端，亲测无法有效拉起摄像头，并且，下面都是手势互动项目，举着手机，手自然也是没法做操控的。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

后两者中，Build 是直接形成一个 app，你可以分享给其它朋友，缺点是 tokens 有限。而 Playground 会生成一套代码，需要下载到本地再打开，一旦换个电脑就可能运行不了，但优点是几乎没有 tokens 限制，每天一百万，量大管饱。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

考虑到交互项目比较消耗 tokens，所以 Playground 更为合适，个别小项目用 Build 也可以，这就看个人情况而定。

Jarvis

Jarvis HUD 面板是在推上超过二十万次浏览的热门爆款，手势操控仪表球，就像钢铁侠操控 Jarvis 那样，酷毙了。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

参考 prompt 如下：

create a webapp using vanilla js， html， css， modern threejs， mediapipe. it should be a sci-fi tony stark / iron man / jarvis experience focused on simulating an AR heads up display experience. full screen webcam input shown. add a heads up display that tracks the user's head (offset to the right)， with live updating metrics. a minimal 3D world globe should be shown on the left center of the screen， that should be able to be rotated / sized by the user hand gestures

在 Build 模式下，亲测完全可以实现一次成型，Gemini 会自动安排任务、编写代码，调用不同的接口，进度条显示完成后，点击 Preview 就能直接打开——记得放行摄像头权限。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

Gemini 3 自己就把效果设计安排得明明白白：左手是放大缩小，右边是转动，双手进入摄像头范围后会显示触控点——这些都是 prompt 里没有的，都是它自己的「想」出来的。

搭配大屏幕或者投影，真的很有 Jarvis 既视感。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

左边的地球建模和右边的面板的内容都是可以改变的，最初 Gemini 3 让右边的面板显示人体体温（显然是凭空编的），后来被我改成了实时显示左侧地球模型的直径。反正就是 vibe 一下，想怎么改怎么改。

雨滴控制

Jarvis 都有了，惊天魔盗团不也得安排上。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

《惊天魔盗团 2》里的控雨术堪称名场面，九年前全靠电影特效，但现在，有 Gemini 3 了。参考 prompt 如下：

用 HTML+JS+ML 模型做个网页应用，通过摄像头检测手势，实现用手势来控制雨滴动画的暂停、静止和升格效果。动画效果保持在雨滴垂直方向，风格参考电影《惊天魔盗团》

这个 prompt 的第一轮表述完全是按照我看电影之后的想法写的，每个细节都可以通过 vibe coding 再调节。根据第一轮 prompt，Gemini 会加入它自己的设计，比如这具体的手势就是它想出来的。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

虽然是用 AI 做的，但是在识别手势动作时非常灵敏，包括不同手势之间的切换都能够快速响应。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

3D 粒子

控制雨滴曾经是非常复杂的特效技术，就在《惊天魔盗团 2》上映之后，有一个饮料公司做了一支广告，通过控制雨滴，实现静态的粒子效果。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

那么参考「控雨术」，Gemini 完全可以实现上面这种结合实拍和速度控制才能出现的效果，最接近的就是 3D 粒子。所以我又做了一个 3D 粒子效果的交互案例。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

非常酷炫！prompt 参考如下：

用 Three.js 创建一个实时交互的 3D 粒子系统。通过摄像头检测双手张合控制粒子群的缩放与扩散，提供 UI 面板可选择爱心/花朵/土星/佛像/烟花等模型，支持颜色选择器调整粒子颜色，粒子需实时响应手势变化。界面简洁现代，包含全屏控制按钮

一次成型，最后出来的交互非常丝滑，尤其是对于手势的识别很准确又灵敏。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

小技巧

涉及到颜色、布局、UI 设计等等细节，如果每次都用 vibe coding 的方式来调节，表述起来会很麻烦。并且每一次 vibe code 都存在抽卡的情况，所以有一个非常实用的技巧是：加上自定义模块，尤其是颜色、大小等，这样可以完全自主搭配自己喜欢的配色方案。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

技能五子棋

由雨滴想到粒子，由粒子想到移动，由移动想到——五子棋！我终于可以做技能五子棋了！！

仔细想想，五子棋不也是一个手势控制、飞来飞去的交互方式吗！飞沙走石移动棋子，力拔山兮移动棋盘，全都安排上！

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

Prompt 参考如下：

做一个手势互动小游戏「技能五子棋」：主页面为五子棋棋盘，默认已经摆放好棋子。当用户做出「单手甩手」的动作时，棋子会跟随甩动的方向飞出棋盘。当用户做出「双手甩动」的动作时，棋盘会跟随甩动方向飞动

Gemini 自己完成了物理逻辑和手势之间的衔接，我的 prompt 只需要描述效果，而具体的速度向量计算、检测阈值，都不用我管。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

它甚至还重新命名了「技能」：万象天引。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

这叫飞沙走石啊 Gemini 老师！

节奏音乐游戏

综合上面的几个尝试，Gemini 的毋庸置疑，而且回想一下这些技能树：手势识别、色彩变化，这些组合起来，不就是小游戏吗？

于是我尝试了更复杂一点的项目：节奏游戏。

音游玩过很多了，但是零经验小白真要做一个游戏、怎么给 Gemini 形容我想达到的效果，还真是花了一点脑筋，后来第一版 prompt 如下：

做一个用手势操控的音乐游戏，主界面为四条音轨，用户上传音乐文件后，四条音轨上按节拍出现光点，用户需要用手势准确拍击出现的光点，背景为复古合成波（Synthwave）风格，背景、音轨和光点的颜色可以自定义调节

这基本上是我能想到的雏形，根据第一版 prompt，Gemini 选择了 Pygame 作为游戏引擎，继续使用 MediaPipe 做手势追踪，并且加入了 Librosa 用来分析音乐。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

选择复古合成波风格是因为它有明确的视觉标志——Gemini 也识别出来了——落日、霓虹渐变色、网格和驶向地平线的道路，非常适合节奏音游。

果然做游戏比前面的一些小交互复杂多了……先是只能识别一只手，得调整；然后是无法上传音乐，得调整；到了第三版才稍稍有点样子

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

但是在体验过中我发现一个比较 bug 的地方：判定线的位置离屏幕边缘太近了，而摄像头的识别范围是有限的，我的手稍微放低一点就无法被识别。

一开始我尝试的方法是，把判定线移动到屏幕居中位置，保证我的手始终能在摄像头捕捉范围内。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

但是又出来一个问题：光点出口和判定线之间的距离过短，留给我的反应时间也很短，更别提点击动作还有一点点点的延迟，整个可玩性大大下降。可是放太低就还是会出现手掉出识别范围的情况。

一时之间我还真想不到这个矛盾该怎么办，于是，我直接去问了 Gemini 能怎么解决。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

它直接指出了这个问题的症结所在，并且提出了「视觉欺骗」的方式来优化体验，并且加了一个自定义滑块来调节偏移，这样一来无论手在什么位置，都可以通过调节滑块来对齐判定线。

天才。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

后来我还指出，感觉光点的出现跟节奏不太一致，为了解决这个问题，Gemini 又加了一个滑块用来调节延迟。虽然我仍然认为它并没有很好地分析节奏型，但是这个滑块的设计还是很有效，尤其是解决了戴着蓝牙耳机导致的延迟。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

小技巧

本质上，只要有 prompt 就有抽卡的情况存在，但抽卡未必就不好。当碰到非常硬伤的 bug，比如始终无法调用摄像头、无法上传文件等等，vibe coding 时反复修改也没效果，不如就直接「新建项目」。

核心功能反映在代码上时，彼此之间有所牵连，重新跑一遍，让 AI 整体性地补足，远比一点点 vibe coding 要更有效率。当然，能看懂代码就会更有效率，可以针对性地解决。只不过，对于完全的零码选手来说，还不如直接重新抽卡。

还在用 Gemini 3 写 PPT？这才是最酷炫的玩法（附提示词）

在 AI 之前，做手势交互的应用，得先学点儿 Touch Designer，最好还懂点儿部署。这些都得一点点翻教程，反复研究，在这个过程中搞不好就被劝退了。

有了 AI 之后有多简单，自然不用多说。更关键的是，手势交互原本的门槛远比生图、做 PPT 要更复杂，却又能让小白零码选手快速领略到做应用的乐趣。

唯一留下的，是对审美的挑战。在这些案例里能看到，Gemini 有点审美，但不多，设计、配色等等都是差强人意。代码的「硬」技能它可以掌握，留给我们的，就是对于审美的挑战。

文章来自于“APPSO”，作者 “APPSO”。

关键词: AI , 提示词 , Gemini 3 , AI教程

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0