身边做短视频的朋友,几乎人手一个剪映。
我一直没学。
不是不想,是觉得一个人又写文章又剪视频,实在太累了。
每次看到朋友坐在电脑前裁素材、加字幕、调转场,花一两个小时才剪出一条两分钟的科普视频,我就在想,有没有更快的办法。
折腾 skill 的时候,无意间发现了 HyperFrames 这个视频生成框架。
因为在基金公司劳作,就顺手试着做了一条讲公募和私募区别的短视频。(要多从自己日常去提需求尝试,熟悉ai的边界)
第一版出来的效果还不错,不用再辛辛苦苦剪视频了qwq。

画面是暖色深底的卡片式排版,标题「公募基金 vs 私募基金」用了很大的字号,旁边有一张带阴影的知识卡片,列着三个关键词:募集方式、投资者范围、披露与流动性。

公私募第一版
最让我惊喜的是底部字幕,关键词会自动用不同颜色高亮。
比如讲到「核心差别不在名字,在募集方式」的时候,「募集方式」四个字还变成黄色字体。
卡片也不是平面贴上去的,有微微的阴影,层次感一下就出来了。
说实话这个效果已经超出我的预期了。
AI 不仅把内容结构化了,连视觉重点都帮我标出来了,这不比我自己用剪映加文字一个个调颜色快多了?
但第一版也有一些明显的问题。
没有旁白,全靠画面和字幕传递信息,看起来像 PPT 在自动播放。
字幕的位置也不太对,有些场景字幕直接挡住了卡片上的内容,关键信息被遮住了。
还有一个问题,整个视频没有任何属于我的标记,看不出这是谁做的。
三个问题摆在面前:缺配音、字幕遮挡、没有个人品牌。
如果是用剪映,这三个问题至少要折腾半小时。
但用 AI 就不一样了。
我直接跟 AI 说:加上中文旁白,字幕别挡住主要内容,片头片尾加上「AI 产品普洱」的标记。
AI苦命劳作后,优化版出来了。

优化后的版本,加了旁白、调整了字幕位置、有了个人品牌标记
旁白有了,配音听起来还行,少爷公主要是不满意就上气泡音吧dog.jpg。
字幕也重新排了位置,不再挡内容了。
片头片尾加上了我的标识,终于有点自己作品的感觉了。
从第一版到优化版,我全程只做了一件事:用自然语言告诉 AI 哪里不满意。
不用拖时间线,不用调参数,不用学任何剪辑操作。
做完这条视频我就想,既然 AI 能按我的要求优化风格,那能不能干脆让 AI 帮我创建一个专属的视频 skill?
这样以后每次做视频,就不用重复描述同样的风格要求了。
于是我把优化版的风格偏好整理了一下,让 AI 生成了一个视频 skill:暖色调深底、卡片式排版、关键词颜色高亮、带阴影层次感、固定的片头片尾。
以后做新视频,直接调用这个 skill 就行。(在 AI 时代下,多沉淀下自己的经验,减少重复性工作,就是棒!)
我又连着做了两条完全不同话题的视频。

用 Claude Code 生成的第二条视频,讲程序员的收入情况

用 Claude Code 生成的第三条视频,讲 openclaw 和 hermes 的区别
说说 HyperFrames 到底是怎么回事。
它的核心思路很有意思:用 HTML 来定义视频。
画面布局用 HTML,样式用 CSS,动画用 GSAP 动画库,配音用 TTS 语音合成。
最后把这些东西渲染成一个完整的 MP4。
听起来像是前端开发才能玩的东西,但你完全不需要懂代码。
你只需要说「帮我做一条讲 XXX 的视频」,AI 就会自动规划场景、写文案、做动画、加配音。
你负责提需求,AI 负责做视频。
中文配音这块分享一个踩坑经验。
HyperFrames 内置的 TTS 引擎是 Kokoro-82M,英文效果不错,但中文长文本一长就报错,因为有 token 限制。
解决办法是换成 edge-tts,用微软的 CN-YunxiNeural 声音。
中文发音自然很多,也没有长度限制,改一下配置就搞定了。
想试的话,安装也不复杂。
在项目里运行 npx hyperframes init 初始化。
接着把 HyperFrames 的 skill 加到 Cursor 里,用 Codex 或者 Claude Code 都行。
然后就可以直接用自然语言提需求了。
说实话,这个方案并不适合所有类型的视频。
真人出镜、Vlog 风格、复杂特效的内容,还是得靠剪映或者 PR。
但如果你做的是知识科普、数据展示、工具评测这类信息密度高、画面以文字动画为主的短视频,HyperFrames 简直是天然适配。
回想起来,我庆幸自己没花时间去学剪映。
不是说剪映不好,它确实是个好工具。
但对我这种需要把公众号文章批量转成短视频的人来说,花几十个小时学剪辑,不如花几分钟学会用 skill。
一份内容,文章发公众号,视频发抖音和视频号,一鱼多吃。
而且最关键的是,你还可以让 AI 帮你打造专属的视频风格 skill,以后每条视频都是统一的个人品牌调性。
如果你也在纠结要不要学剪映,可以先试试这个方案。
不用学剪辑,不用买模板,给 AI 一段话就能出片。
文章来自于"AI产品普洱",作者 "AI产品普洱"。
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales