传统视频制作N个产品来回横跳的工作流模式,这次可能真的要Game Over了?
因为嘛——
现在你只用跟Codex说一句话,它就能把剪辑、PS、视频生成等一箩筐子的活儿全包了!!

就在刚刚,Codex把AI视频生成平台HeyGen接入了自家产品里。
数字人、画面、字幕、外观改变、剪辑、导出全能一锅出,完全不用离开Codex的内种。
最重要支持一键调用,啥skill啥安装包都不需要,插件在手,成片我有~

视频制作友友狂喜,数字人生成友友狂喜,不想付八百个修图剪辑订阅费的我也狂喜!!
大家平时甭管工作还生活里剪辑视频时,应该都有这样的抓马且让人挠头的感觉——
那就是八百个软件切不完,真的切不完……
A软件生图,B软件修图、C软件剪辑,最后电脑卡死不说,把我们自己脑子的CPU也得干烧了!
所以哪怕到了今天,我们似乎也找不到一个能在一个能用「大白话」搞定视频制作全流程的工具。
而Codex这次干的事儿,就是把自家编程工具,跟AI视频生成平台HeyGen来了波梦幻联动——
把生图、剪辑、字幕、配音这些步骤……全变成《代码工作流》。
单这么说,大家是不是感觉和市面上一些AI视频工具没啥区别??
用之前我也这么觉得……但把插件装上后,我才发现自己想得是真有点简单了。(doge)——
因为在Codex里调用HeyGen,本质上是用自然语言或代码指挥AI,生成的是类似HTML+CSS+JS的视频文件。
也正是因为这样,其优势就在于:可编程可迭代、更能让我们精确控制局部细节。
多说无益,我们直接小小实测一把,让友友们直观感受一下~
在Codex中,我们不用装啥skill,直接在插件里搜「HeyGen」就能一键安装,超超超简单:

从第一步「生图任务」开始。
我在Codex里交代给HeyGen的任务是,让它生成一个数字人女孩。
然后我就得到了一张人脸相对比较自然的女孩形象照,皮肤纹理、瞳孔细节、头发丝该有的都有:

图片有了,下一步当然得让图动起来,咱直接试试HeyGen的看家本领:「数字人口播」。

大概过了一分钟的时间,我就得到了一个声画同步的数字人口播视频!
口型完全没问题,主体一致性完成度也比较高,不错不错:

但是,大家要知道,我们之所以想在Codex中调用HeyGen——
看中的不仅仅是它一次性生成的能力,而是能帮我们进行剪辑、局部修改的「加工」能力。
所以我接下来直接上难度,我们在上个视频基础上,让HeyGen把口条改了,并加上相应的「字幕」:

在这个过程中,我还发现了一件挺有意思的事儿。
当Codex遇到一些小问题的时候,它能自己检查机器、调试设备、调配素材、解决故障,最后给你交出一条能直接用的成品。
这也正是绝大多数AI视频生成工具无法做的——
因为Codex本身就是一个会自己想办法把视频做完的AI视频工程师,而不是只会按提示生成一次的工具!!

大概过了几分钟的样子,Codex就在上个视频版本的基础上增加了字幕。
而且蛮让我震惊的是,当替换了新的字幕后,女孩的口型依旧对的非常自然,和新字幕非常匹配:

最后,我直接狠试一波大家最最最关心的「自动剪辑」能力。
这次,我直接给出了一箩筐《甲方需求》,也是大家平时剪辑里最常遇到的——
把10秒以后的内容剪掉。

第八秒女孩闭眼了,把那一秒剪掉。

视频中的字幕变成单行,两行现在太丑了。

大家觉得效果咋样,我是真挑不出啥毛病了。(惊呆.jpg)
可以说每一秒,每一个需求,都剪辑地非常到位,这难道就是Codex+HeyGen的威力吗……
而且这些视频,不夸张,大概10秒钟,就水灵灵地出现在了我的文件夹里:

(文件不需要保存,自动下载到电脑里的那种)

最后,我是真忍不住说一句:
其实——
把视频剪辑工作流打包在一个AI工具里,这事儿真不是HeyGen和Codex头一个想到的。
之前Sora、Runway、Veo这类生成模型都做过,但是在口播讲解,生字幕,加转场这种事情上还是有点费劲。
还有就是今年1月的时候,Remotion+Claude Code搞出一套「视频即代码」。
但门槛还是太高了…你不会React,Claude写出来的代码你看不懂、改不动、出bug也不知道怎么修……

而在Codex中,你不需要懂HTML、不需要懂React、不需要懂FFmpeg,这些词你听都没听过都没关系。
你的工作只剩一件事:《张嘴提需求》。
当然,这本身和Codex和HeyGen的各自优势有关系,我也自己问了问Codex,人家是这么回答的——

是的,Codex写HTML、CSS、JS的水平,目前在所有AI编程Agent里是第一梯队。
HeyGen那边的家底更不用说,算得上是过去五年AI视频赛道里,极少数真正把数字人和视频生产做到能商用的公司。
一个视频能力超强,一个编程能力超强,也算一波《强强联手》了。
当然这些都是一些题外话了,对于我们用户来说,能帮我们省力才是最重要的~
我猜啊,没准过不了几年,剪辑这活儿,没准都跟手敲代码一样,成了一种「复古手艺」了……
让子弹再多飞一会儿吧。(doge)
文章来自于微信公众号 “量子位”,作者 “量子位”
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales