视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业
9730点击    2026-01-30 10:00
需要很多理性,但同时也需要很多感性。


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


🚥 视频剪辑,会迎来自己的「Cursor 时刻」吗?


当编程世界被 Cursor、Claude Code 等工具重新定义之后,一个更难、也更少被认真讨论的问题开始浮现:创作类工作流,尤其是视频剪辑,会不会迎来类似的拐点?


本周「十字路口」邀请到的嘉宾是 ChatCut 创始人李凯文。在成为 AI 创业者之前,他是鞍山卖打口碟的初中生,是罗德岛设计学院的小天才,也是一名广告与纪录片导演,短片作品曾入围金马奖。他拍过商业广告,也剪过大量没有剧本、极度混沌、需要在现实中慢慢“找秩序”的素材。


正是这段经历,让他对「AI + 视频」形成了一套明显不同于主流叙事的判断。


大多数人在押注 AI 生成视频,但凯文坚持"不生成任何像素";大多数 AI 视频工具瞄准专业剪辑师,但他选择服务"还不是剪辑师"的人;大多数创始人在谈模型和算法,但他在谈"炼金师文化"和"上帝之手"。


这些看似反常识的选择背后,藏着一套关于 AI 时代创作工具的全新思考框架。


🎬 这是「十字路口」第一次尝试一种新的视频播客拍摄方式。


这一期,我们没有坐在桌前对谈,而是把整个对话拆成了两个连续的场景:


第一部分,我和凯文一起开车前往郊区——我开车,他坐在副驾,我们在车里边开边聊,持续大约一个小时;


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


第二部分,我们抵达他曾经隐居过一年的郊区湖边,在湖心亭坐下来,继续完成这场对谈。


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


微信收听播客:


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


小宇宙收听播客:


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


🎬 视频播客已同步上线于 @Koji杨远骋 的视频号、小红书、哔哩哔哩、Youtube 等平台


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


由于访谈全文较长(16,994字),可先参考目录:


🟢 快问快答:年龄、毕业院校、MBTI 和星座、一句话介绍 Chatcut、融资情况、团队规模、创业前经历


🟢 离开市中心:上帝之手推你去做自己的 0→1


突然被推到的人生分叉口。


🟢 第一个投资人


VC 的价值不在“聪明”,而在“让你觉得自己也可以很强”。


🟢 产品第一性:剪辑其实大部分发生在 Word 文档里


🟢 早年的冒险肌肉:从鞍山到 Kent,再到 RISD


🟢 导演 vs CEO:片场像 SWAT,创业像长期投资


电影是一次军事行动;创业是把人当资产来复利。


🟢 融资方法论:找化学反应,而不是完美话术


🟢 人生杠杆:有事做,是最大的财富


财富自由的人会羡慕你,不是因为钱,而是因为你有一个值得投入的“事”。


🟢 愿景图景:别再造轮子,但你不得不经历造轮子的过程


未来不是“颠覆编辑器”,而是让 AI 成为剪辑助理,工作在编辑器之上。


🟢 目前最难的问题:风格从哪里来?


“好看”没有 bug 可以测,那风格怎么被 AI 学会?


🟢 关键选择:不做生成像素


世界每天在 AI 革命,但地铁里的人们刷的视频剪法一点都没变。


🟢 技术关卡:上下文与多模态还没到“可剪辑”的成熟度


🟢 为什么“上帝的活”没人接?


找到那个 “yeah this works” 的简单认知。


🟢 别追“绝对正确”,要培养“好习惯”


🟢 模型红利


🟢 “为爱而做的人”


🟢 电影不会消失


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


快问快答


👦🏻 Koji


我是Koji,本周十字路口我们会一边开车一边录播客。本周的嘉宾和我们过去的嘉宾都不一样,他是 ChatCut 的创始人凯文。


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


为什么说他不一样呢?他过去十年的职业生涯都在做导演,而且非常的厉害,第一部短片作品《孽种》就入围了金马奖。


我们还是先从快问快答开始。请问凯文你的年龄?


🧑🏻‍💻 凯文


92 年。


👦🏻 Koji


你毕业的学校?


🧑🏻‍💻 凯文


罗德岛设计学院。


👦🏻 Koji


你的 MBTI 和星座?


🧑🏻‍💻 凯文


MBTI 很久之前测过,已经不准了,就不提了。星座是双鱼座。


👦🏻 Koji


那你自认为自己现在的 MBTI 是什么?


🧑🏻‍💻 凯文


INTP。


👦🏻 Koji


一句话介绍 ChatCut 呢?


🧑🏻‍💻 凯文


用聊天的方式剪视频。


👦🏻 Koji


目前融资的情况?


🧑🏻‍💻 凯文


刚完成千万人民币左右的种子轮融资。


👦🏻 Koji


咱们的收入和利润情况呢?


🧑🏻‍💻 凯文


不太好透露。


👦🏻 Koji


目前团队的规模呢?


🧑🏻‍💻 凯文


10 个人。


👦🏻 Koji


一句话介绍一下创业之前在做什么?


🧑🏻‍💻 凯文


创业之前我是一个广告纪录片导演,之前在 VICE 和 Discovery,也是 Homework Production 的创始人,一部短片在 2024 年入围了金马奖。


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


👦🏻 Koji


我们现在在开车离开上海的路上,就可以聊一聊你的来时路。等我们到了目的地之后,再来聊 AI 以及 AI 产品 ChatCut。我记得有一次你跟我讲,离开市中心是你人生的一个关键词,那是哪一年的关键词?


🧑🏻‍💻 凯文


22 年、23 年那个区间。那个时候我刚拍了很多广告和纪录片,然后遇到了上海比较特殊的时期,突然有更多的时间去做一些思考,比如,我怎么突然拍上广告了呢?


👦🏻 Koji


所以你怎么突然拍上广告了?


🧑🏻‍💻 凯文


16 年底的时候我去了 VICE Media,被派到了 VICE 中国。在美国,你做这种媒体可以通过平台本身的收益赚钱,但在中国,把片子放到爱奇艺、优酷或者腾讯上面,靠流量分钱,几乎是不可能成立的。所以在中国就多了一个 commercial 部门。


👦🏻 Koji


所以你去 VICE 的时候,一开始是认为 VICE 是一个自由表达、做自己内容的地方,来了中国发现商业模式是这样的?


🧑🏻‍💻 凯文


我没觉得那是个问题,我是争抢着做那个商业项目。因为商业项目有更多的预算和人去配合你。


👦🏻 Koji


你其实是主动拥抱了商业?


🧑🏻‍💻 凯文


我彻底地、主动地拥抱了商业。


一部分是从学习的角度,我对那个很好奇:当钱不是问题的时候,我们能有什么样的想法去拍?


另一个是从商业的角度。大学刚毕业的时候,假如我自己去拍一个短片,没有人会要。但如果说我给 Burger King 拍了一个项目,大家看都不用看,就会觉得这小伙好像有两下子,Burger King 都找他拍。给 Adidas 拍过,那得是什么样的人?


离开市中心:上帝之手推你去做自己的 0→1


👦🏻 Koji


为什么拍着拍着,那两年就想逃离了?


🧑🏻‍💻 凯文


广告能带来实打实的技术提高,也有一部分是满足虚荣心。


当纯粹的虚荣感消除之后,我对于做纯广告的兴趣就没那么大了。广告是一个要求非常全面的事情,你有了 idea,还得去说服演员、客户、甲方、乙方的甲方,非常复杂。


当我看见很多人非常擅长做这件事时,我明白了每个人的“品种”不一样。如果硬要去跟别人比广告导演的综合素质,我觉得未必有特别好的结果。


👦🏻 Koji


那个时候想好接下来要做什么了吗?


🧑🏻‍💻 凯文


我们现在去的地方也给了我特别大的启发。当时我们也是拍一个项目,就在那个湖旁边。我去看景的时候,觉得“哇,这太棒了”。


旁边有一个中介,我就说咱们看一眼,可能搬到那不太现实。结果去看了一眼,就看中了一个房子。


有的时候不是你做了一个决定,而是上帝之手在推着你,就是觉得 that's the one。


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


👦🏻 Koji


一见钟情的房子。


🧑🏻‍💻 凯文


我觉得不管怎么样,先抽身出来,再想下一步是什么。


👦🏻 Koji


那个时候开始拍后来入围金马奖的短片《孽种》了吗?


🧑🏻‍💻 凯文


那个时候我开始想要做一个属于我自己的事儿。它可以是一个片子,一个产品,一个 APP。我决定这一年不接广告,憋一个大招。具体是什么不知道,但先让它发芽。


那年我写了很多短片,《孽种》是其中一个,并最终拍了出来。


其实拍《孽种》的同时也是 ChatGPT 刚出来的时候。我生活中开始用很多 AI,也同时生成了 ChatCut 这个 idea。你刚用完 ChatGPT,再回过头用 Premiere 剪片,能感受到这两个时代的交接。


👦🏻 Koji


感觉自己在穿越?


🧑🏻‍💻 凯文


在穿越未来世界和远古时代。


我一直在琢磨做 ChatCut 这个事。上帝一定会把这事给做了,但是不是上帝让我去做?或者说,我要不要把上帝这个活给接下来?


解决一个普通人的问题,听上去既简单又难。它不在于你有多么技艺高超的表达,而在于你对生活里问题的简单但深入的洞察。在这一点上,相比纯工程师背景的人,我觉得我具备一定的优势。


如果让上帝去安排,不一定会安排我,但是如果上帝还没指出是谁,我就把手举起来了。


第一个投资人


👦🏻 Koji


从你萌生想要做这个事情到今天,这中间有哪几个阶段呢?


🧑🏻‍💻 凯文


我就开始深入地想,这个 APP 到底是一个什么样的 APP?刚开始它是一个 “ChatGPT 或者 Cursor for video editing”,但它到底是什么意思?落地之后是一个什么样的 APP?


我一边构思,一边在金马影展期间遇见了 Antler 的合伙人 Eric,一个新加坡的 VC。他会直接说:“和你相处一段时间了,我给你很小的一笔钱,看看你能用这个做出什么,看看你有没有做一个事的毅力。”


我也很有幸,我们遇见的第一个投资人是他,就是那种传说中的 empowering figure。怎么讲呢?有很多人个人能力非常强,个人魅力也很强,但是你坐在他旁边的时候,会觉得自己非常渺小,什么都不是,怎么能跟他比呢?但是有的人,在他个人能力强的前提下,会放大他身边每一个人的能力。


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


👦🏻 Koji


我记得你曾经说过,你见了很多 VC 投资人,好多人都在找你身上不能做成这个事情的原因,但是 Eric 一直在试图寻找你能做成它的原因?


🧑🏻‍💻 凯文


是的,完完全全就是这样。找一个事不能成的原因很简单,世界上大部分的事都是不能成的,如果要找毛病的话根本不用找。


产品第一性:剪辑其实大部分发生在 Word 文档里


👦🏻 Koji


拿到 Antler 的钱之后就开始做,第一版发出来的时候顺利吗?


🧑🏻‍💻 凯文


当时我们的目标用户是一个相对专业的用户。


ChatCut 的大概思路是这样的:你把视频通过某种方式转录成文字。这也来自于我们剪辑的经验,很多时候剪辑是发生在 Word 文档里的。剪辑听上去是一个多模态的事,但实际上剪辑师大部分的工作是以文字为载体。


所以 ChatCut 核心有两点:


一个是用巧妙的方式把视频转录成文字;


另一个是 AI 真正产生价值的部分:怎么把已经转录成的文字编排成新的剪辑,然后通过工程的方式映射到时间线上。


我们第一版的时候其实只做到了第一点,只是把语音做成了转录,人可以通过编辑文字稿的方式去编辑视频,甚至都没有 AI 剪辑的功能。到了 4 月份,我们才刚开始有 AI 剪辑的雏形。


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


👦🏻 Koji


所以一开始是来不及做吗?


🧑🏻‍💻 凯文


如果你有 1000 个 true fans,你出什么他都会用,然后每年付你 30 美金,你把这些人服务好,其实不需要特别大地去 scale,它更多的是一个小而美的 business。


当时我们没有想要做能 scale 的那种大 AI VC-backed startup,we were not ready for it。所以我们能做到的就是做出一个 MVP,找到你的第一个 customer,前 10 个 customer,前 100 个能持续使用你 APP 的人。


现在我的观念变了,但当时我觉得是好的学习经验。就比如你小孩去美国留学,你爸最好别一下在你存折里放 10 万美金,可能一下就染上了不良的习惯。


👦🏻 Koji


所以你的意思是,穷创业反而让你经历了更多,学到了更多?


🧑🏻‍💻 凯文


别人可能有别人的方法,但对我来说,它是特别好的学习途径。


早年的冒险肌肉:从鞍山到 Kent,再到 RISD


👦🏻 Koji


这让我想到,你是从辽宁鞍山,然后去美国直接读高中,而且是在 Kent School,一个非常好的高中。这是怎么做到的?


🧑🏻‍💻 凯文


我小的时候学习属于班里中上等,不是一个特别好的学生,但我对外界的世界特别有好奇心。比如当时的那些电影,有一个我就看一个;音乐,有一个我听一个。只要是唱的不是中文的歌,我就觉得可以听一听,别人都听不明白,我装模作样能听明白。


我爸也比较支持我的这些兴趣爱好。他出差的时候,会帮我买当时一种叫“打口碟”的东西,都按斤买,他直接买一斤回去,我就一个一个听。


👦🏻 Koji


哇,那太开心了,每次收到一斤,像拆盲盒的快乐。


🧑🏻‍💻 凯文


它不仅是盲盒,而且你拆完了也是盲盒。因为不像现在,我拆完一看是涅槃,上网一搜就知道别人说这个好。那时候还没有 Internet,整个评价体系都得你自己去构造,好听不好听完全靠你自己去判断。


因为对外来文化特别好奇,我初中的时候英语就特别好。正好当时 Kent School 来上海面试招生。


👦🏻 Koji


但它怎么知道你的存在?或者说,你在鞍山,怎么知道 Kent School 来上海了?


🧑🏻‍💻 凯文


这是当时做的一些调研。


👦🏻 Koji


你是已经决定要去美国读高中了,所以开始做这些调研?


🧑🏻‍💻 凯文


我想要去美国读高中。一个是我对外面非常感兴趣,看那些美国电影,我觉得那就是我灵魂的所在,当然,后来发现并不完全是我想的那样。


另一个原因是我妈是一个高中老师,出了名的比较“狠”,我的成绩如果不出问题,就会去我妈的那个学校。


👦🏻 Koji


那个时候在鞍山,去美国读高中,仍然是一个极其小众,几乎没有的选项?


🧑🏻‍💻 凯文


完全没有。我对于一个新的事情或者一个新的地方,从那个时候起就一点没有那种“会是什么样?我人生地不熟会不会遇到问题?”的感觉。It's OK, let's just try it。


感觉自己对风险的承受能力非常高。


👦🏻 Koji


那他来上海招生,你感觉自己身上哪些故事或者性格打动了他们?


🧑🏻‍💻 凯文


我在初中的时候开始卖打口碟。首先我有销售能力,另外就是你对一个东西真正有多热爱。


我初中时热爱音乐已经到了疯了的地步。别人春游的时候都带着面包饼干,我背着我所有的打口碟。你在我旁边走,我就把耳机塞到你耳朵里。


👦🏻 Koji


去推销吗?


🧑🏻‍💻 凯文


对,就是说你听这个,买不买不重要,但你听听这个东西,难道只有我一个人觉得好听吗?第一次听到 Beatles,第一次听到涅槃,我觉得这东西太了不起了,你听,你怎么能觉得它不好听呢?


👦🏻 Koji


所以这是非常热情驱动的一个创业?


🧑🏻‍💻 凯文


这是完全热情驱动的。我还记得买到一张 Blink-182 新专辑的首版,当时打口碟的口都打得巨多,但我那张口打得很薄,一首歌都没打掉。


我就给同学打电话说:“Hey, you know what? 我弄到了一张 Blink-182 新专辑的首版,我现在在电话上直接给你听一下。”然后我就打开我的 stereo,在电话里放给他听,问他:“牛不?50 块钱买不买?明天就没了。” 他说:“那给我留两张。”


👦🏻 Koji


我现在听起来仍然是非常快乐的一段创业。这个很幸福,如果别人不买,你也自己留着,也是自己的资产,不会因为卖不掉而苦恼。


🧑🏻‍💻 凯文


太爽了。其实做一个 startup,成不成功,不管个人能力有多强,都有很多因素是上帝决定的。


但是我觉得作为一个创业者,你能做到的,就是选择一个即使失败了也 "it's OK" 的事。


我们一起做的这个事和一起做这事的人,无论成功还是失败,这个过程一定是好的。


👦🏻 Koji


那沿着这条路其实你很容易就会走上,比如说去读个商学院,或者经济、计算机,但你后来去了罗德岛艺术学院?


🧑🏻‍💻 凯文


我高中在 Kent 的时候就热爱上了电影。当时有几个电影学院的选择,美国挺好的一点就是鼓励你去 College visit。


我去了罗德岛设计学院(RISD)的时候,一下就感觉到这儿的人太不一样了。他们的发型、穿着,听的东西、看的东西你都没见过,感觉完全来到了一个外星球。


它是一个特别鼓励独立思考的地方,所以它出来的那些 startup founders 都是感觉有灵魂的那种。


👦🏻 Koji


有哪些?


🧑🏻‍💻 凯文


比如 Airbnb 的 Brian Chesky 和 Joe Gebbia。然后《Family Guy》的创始人也是 Kent School 和 RISD 的,是我的 alumni。


👦🏻 Koji


这还蛮特别的,可能找不出第二个鞍山人有和你相似的经历。


🧑🏻‍💻 凯文


有个作家叫 Kurt Vonnegut,他管这个东西叫 "dancing lessons from god"。我是愿意去 take dancing lessons from god 的。


东北实际上是一个比较保守的地方,可能到我这就是出现了一个基因突变,东北确实很少有这种冒险精神的人,现在越来越少了。


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


导演 vs CEO:片场像 SWAT,创业像长期投资


👦🏻 Koji


都说导演很像一个片场的 CEO,要统筹所有事情。现在你真的创业做 CEO 了,觉得两种 CEO 的角色有哪些相同和不同?


🧑🏻‍💻 凯文


我觉得有很多相同的点。比如,导演是一个对综合素质的挑战。你对世界有自己的认知,有一个 vision,但这只是开始。作为导演,你得有能力吸引到资方、吸引到 crew、吸引到好演员,然后让他们去达成这个 vision。


这需要很强的抗挫折能力、厚的脸皮,以及三顾茅庐的精神,最后去 take complete ownership of the vision。


另外一个特别相似的点,就是导演每次的工作都是从 0 到 1,每个片子都是全新的。


👦🏻 Koji


Always day one ?


🧑🏻‍💻 凯文


It's always day one。我总是要很快地进入舒适区之外的环境,完全从 0 把它到 1 做出来,这个和创业是极其高度相似的。


👦🏻 Koji


不相同的地方呢?


🧑🏻‍💻 凯文


最大的不同是,一个影片拍出来,它就不动了。但是一个 APP 产品,发出的那一天,你才刚刚开始去打造它最终的模样,这需要一个很大的思维模式上的转变。


👦🏻 Koji


刚才说的是作品的角度,那从管理或者经营公司的角度呢?做电影其实也在经营一个临时组建的组织。


🧑🏻‍💻 凯文


我觉得电影的组织是一个纯粹“只筛选、不培养”的合作方式。


广告公司选导演,比如要拍车广告,这个导演得是之前拍过五个一模一样车广告的人,我们才会考虑,因为这个事容不得一毫秒的闪失。


它与其说是一个公司,更像一个 SWAT team,一个特工队。拍片的时候它就是一个军事行动,做决定需要一些“独裁”,就是我们不商量了,就这么做了。而做一个 startup,对人要有一个更长期的态度,更像是一种投资。


👦🏻 Koji


你会觉得做电影导演的独裁感更强吗?versus 做一个 startup,你会怎么看这种不同的管理风格?


🧑🏻‍💻 凯文


导演看上去可能是一个非常独裁的角色,但其实任何好的管理者,不管是公司运营,还是更大层面的独裁,事实都已经证明了独裁这个事本身就不 work。


原因很明显,你如果能找到跟你一路的人,激发大家的能力,十个人聚力去做一件事,肯定要远远大于一个独裁的天才。


👦🏻 Koji


所以你是什么风格的管理者?


🧑🏻‍💻 凯文


我一直把自己当成那个铺马路的人,让大伙来的时候非常顺利,对片子有完全一致和清晰的预判,然后顺利地把事完成。


做一个 CEO,我觉得我真正的工作是给大伙把这个柏油马路铺得特别平。


👦🏻 Koji


你们公司的目标是谁定的?


🧑🏻‍💻 凯文


公司的目标是我们一块去商量。我跟现在的产品合伙人,他有大厂“特种兵”的那种方法论,加上我的一些直觉判断,我们是完全互补的。我们会自己去立一个目标,然后一起去完成。


👦🏻 Koji


你从一个非科技行业的从业者,现在做了一个 AI startup。今天很多人在自己的行业里也有一种受困于此的感受,想去突破它,你有什么建议吗?


🧑🏻‍💻 凯文


事都不是说出来的,也不是学出来的,都是做出来的。


现在 AI coding 的一个好处就是,你没有什么借口说“我不去做一个事”,现在迈出第一步是很简单的。


融资方法论:找化学反应,而不是完美话术


👦🏻 Koji


我们刚才聊到你拿了 Antler 的钱,做出了第一版 MVP。后来是真格投了,刘元 lead 的投资,你和刘元在接触的过程中有什么故事吗?


🧑🏻‍💻 凯文


当时在没有任何 marketing 的情况下,已经有很多付费用户了。要上到下一个 slope,就需要一个真正的 VC-backed startup。


那个时候我开始回国融资,那一个月什么都没干,就是一个一个见投资人,我就像 GPT 一样,得到了深刻的强化学习。


在中间遇到了刘元,我觉得是上帝之手把我们俩放到了一起。中国这么大,这么多投资人,out of all the investors, out of all the startup founders, we were able to meet。他是一个特别喜欢电影的人。


做 AI startup,需要很多理性,但同时也需要很多感性。


你看数据看多了,感性的一面就容易被磨灭。能保持感性、保持对世界天真看法的人,非常少。刘元就同时具备真正的感性和好奇心。


给我印象最深的是我们聊了很多电影。我一开始以为他只是把我放到温水里,最后要“煮”我。我也给他推荐了很多电影,但他会凌晨 2 点发消息说:“凯文,我看了你发的那部电影”。他是真的好奇,我觉得这非常少有。


👦🏻 Koji


对电影的共同好奇,怎么就导向了投资的发生?或者说你们对事业上共同的追求和彼此的认可?


🧑🏻‍💻 凯文


他真的是在试图完完全全地了解我,在建造一个我的模型,以便对未来做出判断。


他不喜欢所谓的“正确答案”。我觉得这就像赌马,A 的胜率 70%,B 的胜率 30%,理性的人都会选 A。但即使你赌对了,也不会有太大的满足感。


得是你做了一个特殊选择,然后你对了,但大多数人都错了,这个时候你才会得到更多的满足感。


在这一点上,刘元跟我一模一样。做了一个大家都认为对的事,可能 it's just fine。但如果是做了一件给别人“打脸”了的事,that's even better。


👦🏻 Koji


哈哈,都在追求各种体验。你刚才说见了非常多 VC 之后,有一个强化学习的过程。有什么 tips 可以给到其他还在融资的 founders 吗?


🧑🏻‍💻 凯文


首先放平自己的心态。你不管怎么样,都没法练出一套完美的话术,每个都中是不存在的。


世界上有很多 VC,你要找到的是跟你能有化学反应的那个。因为投资不是一次性的事,不是说投完人就走了,而是大家会在同一条船上待很久。


👦🏻 Koji


像一个长期关系的开始?


🧑🏻‍💻 凯文


它就是一个长期关系的开始。事情发展的线不是“我一点一点接近了,最后融到了”,而是它发生之前看上去都是不可能的。所以要面对拒绝,然后去聊下一个。


不是所有事都能得出一套方法论,你得不断地去尝试,试这个、试那个,有一个灵了,也没有什么特别可复刻的原因,就是天时地利人和,这事就成了。天时地利人和没凑齐,就不行。


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


人生杠杆:有事做,是最大的财富


👦🏻 Koji


哇,这里好美。


🧑🏻‍💻 凯文


这个湖巨大,大到像一片海。


我开始做 ChatCut 后,我那些很有钱的高中同学,以前都是我羡慕他们,现在当我和他们聊起我在做的事,我第一次感受到了他们对我的羡慕。


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


👦🏻 Koji


哇哦。


🧑🏻‍💻 凯文


一个人有事做,是你最大的财富。


👦🏻 Koji


我同意。我人生最痛苦的一段时间是 14、15 年,那时候聚美上市了,我 29 岁,有了一笔钱,然后我就裸辞了。我去了美国,住在一个朋友家,他当时已经买了一个湖景房。他白天去上班,我就自己在他三面环湖的客厅的白色大沙发上躺着。


第一天心情非常好,还自己换上装备出去绕湖跑步。然后第二天、第三天……到第四天的时候,我第一次感觉到了什么是抑郁。摸手机没人找我,再摸手机还没人找我。


感觉世界离我远去了,没有人 care 我,我也不知道还能和谁发生联系。


那个真是巨大的痛苦,从那以后我就知道了,必须找事情干,躺着根本不快乐。


🧑🏻‍💻 凯文


是的。


👦🏻 Koji


你当时在这里住了几个月?


🧑🏻‍💻 凯文


这片住了一年。春夏秋冬四季都经历了。


👦🏻 Koji


住在这里的时候,生活方式是什么?


🧑🏻‍💻 凯文


当时有车,每两周去一次山姆,买所有的吃的东西。当时对健康比较有意识,每天多走路,要 work out,还开始冥想。


👦🏻 Koji


那一年的开头和结尾,你觉得自己有什么变化吗?


🧑🏻‍💻 凯文


我觉得那一年开头和结尾,我已经完全不是同一个人了。之前是一个上海的广告纪录片导演,经过那一年,我觉得可以摆脱那个身份,以及任何一个身份,自己有了更强的定力。


👦🏻 Koji


你当时做导演的时候一天的酬劳是多少?


🧑🏻‍💻 凯文


一天 10 万块钱。


那就是 normal life,you know, I show up is like。但是我觉得导演是一个没有杠杆的 business。


👦🏻 Koji


是用时间换钱。


🧑🏻‍💻 凯文


有了 ChatCut 这个 idea 之后,我觉得这个东西有强烈的杠杆,但同时我仍然在做我喜欢的事。


👦🏻 Koji


你做到现在,ChatCut 的多数过程你还是享受的?


🧑🏻‍💻 凯文


有一本书叫《Man's Search for Meaning》,挺有名的。过程的享受和痛苦是不矛盾的,更多在于你做的这些事,你是否 believe in it,你根本上觉得它有没有价值。


如果你觉得有价值,其实越难受,最后你是越享受的,它是成正比的。


👦🏻 Koji


越难受感觉越享受?


🧑🏻‍💻 凯文


这就像电影一样,不经历九九八十一难,直接“哎,西天到了,咱们取经吧”,那就不好玩了。


👦🏻 Koji


所以你其实在期待着一些磨难?


🧑🏻‍💻 凯文


影视真的是一个纯高强度的压力测试。片场能发生的事,你很难想象会在日常生活中发生。所以现在对我来说,从抗压的角度讲,没有什么磨难能触碰到我。


👦🏻 Koji


所谓的“关关难过,关关过”,然后也更自信可以解决很多问题。


🧑🏻‍💻 凯文


甚至是说,“关关难过”这个假设,本身还是为了“关”后面的那个东西。但对我来说,that's the job,而不是为了后面的东西。如果这个“关”不存在,I have no job。


👦🏻 Koji


哈哈,很有意思。


🧑🏻‍💻 凯文


有一本书就叫《The Obstacle Is The Way》。


👦🏻 Koji


障碍本身,难关本身,它就是一种生活方式,就是道路本身。


当时做导演拍片的时候,你遇到的最大的难关是什么?


🧑🏻‍💻 凯文


还真没有哪个是单一的巨大难关,就是 everything goes wrong。而且,“everything goes wrong”的假设是“it's supposed to go right”。


但是我的心态是,nothing's supposed to go right. Of course it goes wrong. That's the job。


愿景图景:别再造轮子,但你不得不经历造轮子的过程


👦🏻 Koji


我们现在终于到了湖边。这就是你经常会来的一个地方吗?


🧑🏻‍💻 凯文


是的。之前住在后面的小房子里,早晨第一件事可能就来这里了。


👦🏻 Koji


我们再来聊一下 ChatCut。ChatCut 在做的事情是用自然语言帮助做视频编辑。有人觉得这是一个一定会发生的未来,但也有些人认为它可能永远不会发生。


我理解你肯定是相信它一定会发生的,所以你才选择做这个事情。那你在想到它的时候,脑海里面有一个什么样的图景?


🧑🏻‍💻 凯文


我觉得它不是“一定在未来会要发生”,而是在过去,视频就是这么剪出来的。


你可能觉得视频是一个剪辑师在 Premiere 里的操作,但视频都是通过聊天的方式剪出来的。客户拿着微信说,“这个镜头给我放这,那个镜头给我放那”。


当然,特别细的活儿,比如“我就要把这个东西挪一帧”,手挪一下肯定比用聊天说半天来得快。但是,比如我们现在这一大段采访,扔到 ChatCut 里面,你可以说:“刚才提到了这几个点是不要的,我记得当时说的这句话很好,放到最前面,帮我加上合适的音乐和 MG 动画。”你可以说这样一句话,它就可以帮你剪出一个大致的效果。


我觉得未来 APP 的形态,有些事不用有天翻地覆的表象变化。比如剪辑器,它是一个被解决过的问题。Premiere、Final Cut、达芬奇甚至剪映,它们在编辑器这方面 99% 是重合的,高度相似,因为经过时代的打磨,轮子就是圆的。


👦🏻 Koji


你不打算重复造一个轮子了?


🧑🏻‍💻 凯文


我觉得造一个轮子没有特别大的价值


目前最难的问题:风格从哪里来?


👦🏻 Koji


如果说我们的愿景是做一个自然语言的视频编辑器,这中间会经过几个步骤?


🧑🏻‍💻 凯文


你不用去完全造这个轮子,但你不得不经历造轮子的过程。因为你没法拿着 Premiere 来做你的底层,直接在 Premiere 里面去改。你可以做插件,但会受制于人。所以轮子在不同程度上你还是要做。


但最核心的部分是 AI,是抽象的部分,是它怎么去扮演一个“剪辑助理”的角色。它得掌握剪辑工作流里的一些真实流程,而不是在页面上搞一些所谓的创新。AI 主要解决的是功能之上、编辑器之上的思维层面的问题。


ChatCut 像一个小学生,下一步的工作是把他送到高中、大学,让他对世界有自己的判断。当你把素材扔进去,他可能不用等著你“指哪打哪”,而是一看素材就明白了,然后告诉你这个东西怎么做,给你剪出一个高于你水平的视频。


👦🏻 Koji


所以第一步在做的,还是要再造一个编辑器吗?


🧑🏻‍💻 凯文


我们的工作是一个比较平衡的发展,有编辑器的成分,也有 AI 的成分,不是说先造出一个编辑器,造完之后再开发 AI。


👦🏻 Koji


在过去这一年多做 ChatCut 的过程中,你思考最多的问题是什么?


🧑🏻‍💻 凯文


核心的问题可能是“风格”这个东西,风格到底来自于什么?


👦🏻 Koji


指的是影片的风格吗?


🧑🏻‍💻 凯文


对,影片的风格。剪辑有两个层面,一个是涉及到对与错的东西。比如一句话没说完卡掉了,这就错了;我让你剪掉口水词,你没剪掉,也错了。但是在解决了这些基础问题之后,它就没有对与错的分别了。


比如,现在每个 YouTuber 或者自媒体都有很强烈的个人风格。在整个剪辑过程中,怎么去理解风格化,怎么用 AI 去复刻这个风格化?我觉得这是一个还在探讨、没有人有答案的问题。


👦🏻 Koji


我理解这个难点在于它很难有强化学习需要的反馈闭环。AI coding 之所以能那么快发展,是因为有 bug,这个反馈很明确。


但是一个片子好不好看,非常主观和风格化。在你思考的过程中,你觉得它可能通过什么方式去解决?


🧑🏻‍💻 凯文


比如我剪 VICE 或 Discovery 的片子时,我的思路不是“OK,李凯文来了,咱们拿出自己的风格剪一下”,而是 follow 一个 process,遵循自己的一个流程。


因为我用这样的一个流程,不把我的 ego 放在里面,比如素材量很多,但没事,我们先看采访;采访也很多,记不住,我们先弄一个 Word 文档。所以为什么说剪辑很多时候是文本上的工作。


每次我 follow 这样的一个 workflow,最后就导致我形成了这样的风格。它不是一个 A 点到 B 点的问题。


如果你用传统工程的思维说,“这是 A,这是 B,咱们强化学习,大力出奇迹”,这就像武侠小说里的“走火入魔”,没找到问题的关键。


但如果你观察他在第一步用了一个什么样的技巧,导致了成片是这样,它会帮助你自然地形成那个风格。


关键选择:不做生成像素


👦🏻 Koji


那这个要怎么变成 ChatCut 的一种能力呢?


🧑🏻‍💻 凯文


下一步的工作,就是我需要把真实的剪辑师工作流做成不同的 agent 工作流,然后去观察他们在不同语境、不同素材里的不同表现,很多东西需要人去定义。


你说得完全正确,剪辑里有很多人类的 common sense,它没有内化在 LLM 的训练数据里。所以,一些工作流的先后顺序,这些小的 checklist,这些细节,实际上在很大程度上决定了成片的样子。


👦🏻 Koji


今天做 AI 视频的工具蛮多的,大家路径不同,这里面有很多关键选择。比如用什么模型?给用户多少自由度?要不要做 workflow?用不用生成的画面?还是原教旨地只用用户拍摄的画面?在这一系列关键选择里,你认为自己已经做出了哪些非常清晰、笃定的选择?


🧑🏻‍💻 凯文


我们的目标就像 1+1=2 一样清晰,因为我们自己就是用户。当问题出现时,可以直接想一下,现实生活中每天在拍东西、在创作的这些人,他们的需求是什么。


我觉得 AI 生成视频没有给真实世界带来特别大的影响。比如你坐在飞机里,看前面那人看的是什么?你在地铁里看见一个人刷抖音,他刷到的是什么?这些视频是怎么剪的?一点都没变。视频是怎么出来的?也一点都没变。


世界是矛盾的,有的东西看上去每天都在天翻地覆地革命,但有些事就像我们坐在这湖边,一点也没变。我们的 AI,一直把它比作一个蓝领,是世界上最接地气的 AI,解决的就是最真实的创作者的工作流。


假如在这个工作流里你解决好一个问题,that's a billion dollar business。比如 Frame.io,它就是做视频 review(审片),这是多 niche 的一个 market,但它就是 a multi-billion dollar company。因为它不那么 sexy 地解决了一个真实世界的真实问题。


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


👦🏻 Koji


也有另外一个观点,认为视频剪辑是环环相扣的。你举例的审片其实不在剪辑工作流里。正因为剪辑环环相扣,大家会很谨慎地去改变自己的工作流。你做到现在,有看到什么苗头吗?剪辑的哪个环节会因为 AI 的出现产生改变?


🧑🏻‍💻 凯文


你的这个评估在我们的现实中也得到了验证。一个专业的剪辑师,你很难去触动他的工作流。


我们之前 target 很多专业剪辑师,后来改变了 target,也是因为意识到了这个生态系统的庞大。我没法造出一个 Premiere,然后在 Premiere 上面加一个 AI。


👦🏻 Koji


所以你们改变了对目标用户群的定义?


🧑🏻‍💻 凯文


对,因为轮胎跟地表接触的时候就醒悟了。现在对我来说最 exciting 的是,我们的用户可能之前都不是剪辑师。


比如说,他是一个一直想做内容、想起号的自媒体人,之前觉得剪辑是他不做这事的原因,太难了。现在拍摄特别简单,拿个手机拍,画面不比相机差,但剪辑是最重要的卡点。


我觉得解决他们的痛点,能一下让他们达到 80 分,我们给这些人提供了巨大的价值,甚至比让专业剪辑师提高 1.3 倍工作效率更有价值。


👦🏻 Koji


可以在这里举个具体的例子吗?这些新的目标用户因为有了 ChatCut,现在剪出了什么样的新片子?


🧑🏻‍💻 凯文


其他 AI 视频 APP 生成的东西,你一看就知道是哪个工具做的。这是 Google Veo,那是 Kling,即梦,漫画风的又是某个工具。但用 ChatCut 剪出来的片子,你完全看不出 AI 痕迹,因为它只改变剪辑,不生成任何像素,和你用 AE 去做MG 动画是一样的。


所以我们用户群里分享的视频,风格天差地别。比如有位老师,他发现可以直接把课件大纲扔进去,生成 MG 动画,再录一段自己的讲解视频,用 ChatCut 简单剪辑,一个自媒体账号就做起来了。还有做房地产视频的,现在也能自己搞定了。


👦🏻 Koji


我看到另一种路径,他和你们的目标用户一致,都是服务那些想用视频表达但还没有能力的人。有些产品的做法是帮用户生成视频,再用生成的视频剪辑出完整的片子。因为他们假设用户自己拍摄是困难的,视觉语言的表达很困难。


因此,用户只需要有 idea,产品把 idea 翻译成视觉,生成出来,再组合成片子。


但这显然不是你们选择的路?


🧑🏻‍💻 凯文


这就是我们对未来有一个不同的认知和判断。我觉得视频根本的存在原因是什么?它是一个人与人之间交流的东西。如果里面的内容完全跟现实世界无关,你很难去感染一个人。


你录一个很粗糙的视频,但只要是一个真人在对观众讲故事,它所引发的共鸣,不是“不专业”所能掩盖的。因为这个人有生命力。


AI 可以取代很多东西,但它取代不了这种最核心的生命力。生成视频可以是一种创作手段、一种艺术手法,但如果认为它能完全代替真实拍摄,那就是对世界的一个错误判断。


技术关卡:上下文与多模态还没到“可剪辑”的成熟度


👦🏻 Koji


你觉得可以有部分生成,但不能是全部生成。因为全部的生成没有世界的真实样貌,很难打动人。


今天虽然 AI 做了很多突破,但还是有很多做不到的事情。从此刻到有一天,一个真正的自然语言视频剪辑工具诞生,这中间还有哪些技术上做不到的事情需要去逐一突破?


🧑🏻‍💻 凯文


首先是上下文的限制,这个一定要突破,因为视频是一个消耗大量 token 的东西。


然后是多模态的发展,实际上多模态现在还没有一个真正意义上特别成熟的模型。Google 的 Gemini 算是一个好的开头,它对音频和里面说的话有个大概的理解,但还没精准到能去做剪辑的程度。


我觉得多模态和上下文会是比较大的突破点。


👦🏻 Koji


今天 Cursor 之所以成立,是因为背后有大量的代码作为训练材料。但要做一个“cursor for video editing”,背后没有那么多开源代码,因为视频剪辑的知识都在剪辑师的脑海里。


没有这些东西,要怎么训练一个 AI 来完成剪辑工作呢?你们现在是什么思路?


🧑🏻‍💻 凯文


剪辑没有那么多“代码”,不是因为它比编程更难,而是因为它包含大量 common sense,而 common sense 是 LLM 本身就具备的。


另外,我觉得剪辑还是得分成两块去提高。一个是能验证的东西,比如剪口误,做成抖音风格,变成竖屏 16:9?这些是能验证的。另一部分确实是好与坏那种感觉上的。


我觉得,如果能做到第一个程度,能指哪打哪,其实就已经提供了巨大的价值。只要你话说得清楚一点,要什么说明白一点,它就能提供巨大价值。


另外,我们也得通过自己的平台去收集这些信息,一个是调优我们的 prompt,另一个是我不敢说这个事是不是一个训练模型能解决的事,但是我们自己做一个平台的优势就是我们可以去积攒这些信息。


为什么“上帝的活”没人接?


👦🏻 Koji


我觉得你还在挑战一个非常难的事情。你来的路上我们聊过,觉得这个事情是上帝一定会选一个人来做,因为它一定会发生。


你之前在看谁会接上帝这个活,好像没人接,然后你接了。那为什么没有人接呢?


🧑🏻‍💻 凯文


This is interesting.


👦🏻 Koji


因为其实有两种创业状态不一样。一种是我在做的事情,一万个人都在做。另一种是我在做的事情,没别的人在做。


你好像在后者,但这两种各有各的好与不好?


🧑🏻‍💻 凯文


我觉得我们也不完全是在后者,甚至可以说,很多人觉得我们在前者。很多创业者也会觉得自己在前者,也把我们归类为前者。


但我之所以说“上帝的活没人接”,是因为要锁定一个方向、找到一个好的切入点和方法论,是一件非常难、非常细腻的事。它通常不是一个天才的、划时代的想法,而是一个很简单的认知:“Yeah, this works. 我需要的就是这个。”


恰巧我的纪录片背景在这方面起到了特别大的作用。纪录片属于 unscripted(无剧本)创作,现在我们讨论的几乎所有 content creation,比如 YouTuber,都属于 unscripted。与它相反的是 scripted contents,那是电影的创作,有严格的脚本。


剪辑 scripted 内容时,要解决的不是“我选哪句话”、“怎么筛选内容”,逻辑是铁打的,你要解决的是“我怎么找到这句话最好的表演”。我觉得这是 AI 不要去碰也解决不了的问题。比如梁朝伟对张曼玉说“我有个船票,你会不会跟我走”,他有 100 个 take,你让 AI 去选?Forget it, it cannot be done.


而在 unscripted 层面,纪录片是最难的。因为素材量巨大,而且目标最盲目。你像王兵拍《铁西区》,拍了三年,也要剪三年,最后剪成三小时。你不是带着脑海里的印象去剪,而是要完全面对每天的拍摄,有机的形成一个有生命力的东西。


但你找到了这个东西之后,它的工作流可以完完全全复刻到你拍抖音上,因为它们是不同程度的同一个问题。比如你拍抖音,去长白山滑雪拍了一堆 random 的东西,你在一个比较低的程度上,是在解决王兵导演解决的同样问题:在一个无序的素材里,怎么找到规则?


非常巧,我在 AI 出现之前,就在为央视、探索频道、VICE 做大量的纪录片,所以我对这种混沌(chaos)、虚无的宇宙,I've seen that。我从中得到的经验,恰巧是现在内容创作增长的最大趋势。自媒体、YouTuber,其实都是纪录片。我们现在做的,你可以觉得是一个 podcast,但 to me, it's a documentary。


另外,我当时迈出这一步的时机也特别好。LLM 已经出现了一到两年,但 AI coding 才刚刚出现。因为 Antler 是第一个投 Lovable 的公司,所以我们有无限量的 Lovable credit。我


刚开始的时候就想,既然有 Lovable,那我直接 vibe 就好了,还等啥?现在想起来,在那个时候开始做,到现在能有一定的起色,相比你现在才想做,我觉得时机已经稍微有点晚了。这个世界没有停滞不前。


👦🏻 Koji


你把这个坑给占住了?


🧑🏻‍💻 凯文


我的这个萝卜已经扔进坑里了。你也可以硬塞一个萝卜进去,但是 life is not gonna be easy for you。


别追“绝对正确”,要培养“好习惯”


👦🏻 Koji


像你刚才提到的,拍了三年的素材,最后整理成三小时有生命力的故事,这其实是有一些 know-how 在自己肌肉里的。


你是怎么把这些方法落到 ChatCut 这个产品上,表现成一些功能的?


🧑🏻‍💻 凯文


有一种 self-help 的理论说:一个人一年内会取得什么样的成绩,不在于他列了什么样的目标,而在于他养成了什么样的习惯。


我觉得这个在 AI agent 里是一个被低估的方法。很多人觉得 AI 应该是一个“这是原素材,这是结果”的线性连接。但实际上,剪片有很多机缘巧合的成分。


我可以这么剪;我找素材的时候,本来没在找这个,但一看到“欸,这个放这儿 works”。它没有什么绝对的对与错。所以你如果用 AI 去找一个绝对的对与错,它永远都会是错的。


你只能去给他养成一个好的习惯。比如,当你这个地方有缺失的时候,你要去看素材;当你的故事发展到这儿的时候,你一定要去找一个这样的 sound bite;你在这个 scene 转场的时候,要尽全力去找一个 transition。是这样的一些点,而不是说“这是原素材,这是好的剪辑,我给你 10 万个样本”。


还是要去找到一些细微的点,而这些细微的点决定了宏观的样子。


模型红利


👦🏻 Koji


你是非常原教旨的自然语言剪辑派吗?比如也有人认为,自然语言可能只能解决一半甚至更少的问题,还是有很多剪辑需要用拖拽、滑动来完成。


🧑🏻‍💻 凯文


我觉得这是我们在找的一个平衡。


从原则上来说,剪辑一定是一个人机互动的事。AI 再强,我看不到它有一天能完全取代一个人。所以在 ChatCut 里面,时间线的编辑是一个比较重要的功能,我们的文字编辑也花了很长时间去做。所以原则上肯定不是 100% 依赖 AI 去完成所有剪辑。


甚至我觉得,假如 AI 能达到 80% 但给人空间去改,相比于 AI 达到 90% 但人改不了,我宁可要那个 80%。


👦🏻 Koji


从你们做 ChatCut 开始到现在,模型也经历了很多发展。你感觉到最近这一两年哪些突破对你们的帮助最大?


🧑🏻‍💻 凯文


我觉得分成两个部分。一个是对产品的帮助,Gemini 2.5 出来的时候,对我们的产品是一个巨大的帮助,这次 3.0 也是。


👦🏻 Koji


可以分别讲讲帮助是什么吗?


🧑🏻‍💻 凯文


以前用 Claude 或 GPT,上下文长度不够,半小时的视频就可能爆了。现在 Gemini 的 1 million 甚至 2 million token,基本上解决了这个问题。


过去做视频剪辑,首先想到的就是要做 RAG,建 Vector Database,核心就是为了解决上下文。现在可以暂时不用考虑了。


另外,我们的 MG 动画功能,很大程度上是基于 3.0 才得以成立的。我们也做生成式 AI,但和别人不同,我们不生成像素。我觉得生成像素是 where I draw the line。我们生成的是代码,这样用户就可以像做 PPT 一样使用它,它只是替你做了 PPT,而不是给你生成一个奥特曼踩扁房子的画面。


👦🏻 Koji


多模态的进步好像对你们影响不大?因为你们不用生成内容。


🧑🏻‍💻 凯文


多模态的进步,在这个阶段对我们影响不大,但它是一个绕不过去的东西。


下一步我们会融入更多多模态的能力,一个是用来分析,一个是用来生成。我们不是完全不想做生成,而是不想做那种无效的迭代,就是说人家出了个新模型,我们也连一个 API,表现得自己很勤奋,但实际上不增加价值。


我们得有一个好的切入点,在模型 API 之上,加入与剪辑的好的结合,这个对我们来说才是值得做的事。


视频剪辑的「Cursor 时刻」来了?|对谈 ChatCut 创始人李凯文:从金马导演到 AI 创业


“为爱而做的人”


👦🏻 Koji


在你看来,未来什么样的一个图景,你会觉得 ChatCut 算是达到你想象中的成功了?


🧑🏻‍💻 凯文


我可以绕一点回答这个问题。比如 Sora 刚出来的时候,我们刚开始琢磨做 ChatCut 这事。Sora 的 demo 出来,当时那个滑雪的视频一看,就觉得还拍什么电影,以后用这个就完了。


当时世界一下就慌了,它的东西标识性很强,一看就是“哇,Sora 真厉害”。


这是一个好事,也是一个坏事,它限制了创作者在其中的参与部分。因为不管你怎么 prompt,它最后出来的还是一个 Sora 的东西,是一个可辨识的东西。我觉得这是我们要回避的,它不应该是一个限制别人的工具。


对我来说,成功是 ChatCut 变得像你写邮件或日常工作里用 ChatGPT 一样,它已经跟质量没什么关系了,因为每个人都可以用它。但你用它做出来的东西,最后还是达到了你自己的水平。


👦🏻 Koji


这很有意思,一开始我们以为有了 ChatGPT,大家的能力都会被拉到 1000 分。


🧑🏻‍💻 凯文


是的。但事实是,就算你有一个上知天文、下知地理,并且一直可以操纵的朋友,你应该是一个天才,但我们并没看到有特别多的天才出现。


👦🏻 Koji


我们来聊一下团队。之前你在十字路口的开放麦有一个分享,我印象很深,你讲你们团队里有很多“炼金师”。可以再快速介绍一下炼金师是什么样的身份吗?


🧑🏻‍💻 凯文


一个炼金师一定是一个双重身份。他本来有自己的职能,比如工程师、研发、设计师、产品。


👦🏻 Koji


炼金不能当饭吃,只能当副业?


🧑🏻‍💻 凯文


炼金是副业,不能当饭吃。或者说,炼金师是一个荣誉,当你做一个东西做到一定程度的时候,你就是一个炼金师。


给它的定义,有点像古希腊的词“amateur”。我们现在把它翻译成“业余”,但实际上什么是 amateur?他是为爱(amor)而做的一个人。与他相反的是“专业的人”,是为了钱做这事。


当然钱是一个基础,但我觉一个东西的突破,往往来自于一个人内心对它的执念。


现在有了 AI coding,可以让团队规模不那么冗余,让每个人都更大地发挥自己灵光一现那方面的价值。


👦🏻 Koji


所以在 ChatCut 里面,有哪些功能或者部分,是因为炼金师为爱而做的?


🧑🏻‍💻 凯文


MG 动画对我们来说是一个突破。它不在我们的 PRD 或者每周的目标里。是我们的产品同学自己对这个东西有执念,他在做其他事的时候,就一直在 vibe 这个东西。结果他刚做出来两天,Gemini 3 就发布了。Gemini 3 一用,那咱们别的事先放下,先做这个。这就是命运给我们的一个机会。


另外,可能有人会把这个说法理解成不尊重工程师,其实工程师也可以是炼金师。甚至说在这个 AI 时代,工程师最好也学会炼金。只有这样,AI 才不会淘汰掉你。


你如果只是严格按照作业去做,AI 会逐渐自己把作业给做了。


👦🏻 Koji


听起来你是在营造一个比较 empower 大家的团队氛围,激发每个人比较自由地为爱去做一些灵光一现的功能。那在面试的时候怎么去找这种人呢?


🧑🏻‍💻 凯文


之前可能更关注一个人的技术背景,他有没有能力解决我们需要解决的问题。现在更关注一个人的综合素质。


可能他特别喜欢吃一个东西,或者对某个东西特别感兴趣。如果你对任何一件事都没有兴趣,那你可能对任何事都不会有一个好的标准,就很难去炼金。


👦🏻 Koji


这会让我想到 Google 曾经的“八十二十”文化,20% 的时间给大家自由创造。今天很多伟大的产品,比如 NotebookLM 都是这样做出来的。


🧑🏻‍💻 凯文


我觉得可能很多伟大的产品,都具备一定程度的炼金成分。比如 Claude Code,它不来自于一个立项,就是那个人自己想给自己做一个东西,然后 it works。


我们管他叫“炼金”,但这个词实际上一直存在,它叫“tinkerer”,他在鼓捣、在研究这个东西。他的工作就是,“欸,咱们试试这个,nothing。再试试这个”。


我觉得下一步我们需要提高的是:如何将这种意外的收获,系统化地去制造出来。


👦🏻 Koji


它有可能系统化吗?


🧑🏻‍💻 凯文


我觉得完全有可能,这就是管理的难度和意义所在。如果只是 1+1=2,那就没什么意思。


系统性地制造,就像《Antifragile》(反脆弱)的理论,你得去制造利于你的意外,因为那个的杠杆远远大于 1+1=2。


👦🏻 Koji


所以你还是蛮期待意外的发生?这是不是也是因为,你暂时还没看到一条非常清晰的路怎么通向终点?


🧑🏻‍💻 凯文


No, 我觉得是完全相反。正是因为我能特别清晰地看见这个东西的结果,所以我不用摁着团队的脖子说,“按照大哥的意思走”。而是这个结果它特别清晰,所以你走这条道能到,走那条道也 OK,我能放心大胆地让大家去走。因为我能看见那个东西。


当你能听见音乐的时候,你弹什么都是对的。


相反,如果目标不清晰,你做什么都是错的,老板不知道自己想要什么,所以我做什么他都不会满意。


电影不会消失


👦🏻 Koji


如果生活的幸福度满分是 10 分,你觉得你自己现在有几分?


🧑🏻‍💻 凯文


我觉得我现在是 9 分。


👦🏻 Koji


非常高。这是一直都很高,还是最近这么高?是 ChatCut 带来的吗?


🧑🏻‍💻 凯文


我在跟别人提到 ChatCut 的时候,第一次能感受到我身边一些财富自由的人投来羡慕的目光。是因为我有事可以做。而且这个事不是一个 arbitrary(武断)的事,不是说我做了一下市场调研,觉得 "there is money in AI video editing"。


👦🏻 Koji


是因为你在为自己的热爱去做?


🧑🏻‍💻 凯文


我能感觉到上帝的手在推动这事。虽然我一直说上帝,但我其实是一个无神论者。This is my life's work。能找到你的 life's work,能找到 VC,it became a real project,这种事发生的几率不高。


人生就是一部电影,有的时候你得知道这是电影的哪一幕。This is a good scene。电影里的很多悲剧,是那种好事发生的时候他不知道珍惜。


作为观众,你会觉得“这个男人不懂事,这个女的这么爱他,他都不知道珍惜”,最后他有一个悲惨的结局。


我在这个电影的故事线里,没有那个问题。I know it. I know I'm very lucky.


👦🏻 Koji


你知道自己被爱着。那失去的一分是什么?


🧑🏻‍💻 凯文


我觉得当一个人特别具有竞技心理的时候,他可能就不会完全快乐。


我可能会有一天到达那个境界:既能高效地做出所有工作上的决定,又能保持心态完全平静。


但今天的境界还是一个受 ego 一定程度操纵的状态,有一种跟别人 compete(竞争)的心理。


这可能是在这个阶段需要的东西,但它的存在会让你的幸福指数稍微降低一些。


👦🏻 Koji


如果有机会,你还会想要做导演吗?


🧑🏻‍💻 凯文


导演是我任何时候都可以做的一件事,正是因为这个,我不会特别着急说“我几年没拍片了,我得拍一个”。我现在做的每一件事,都是让我成为一个更好导演的燃料。


我在罗德岛设计学院第一天上电影课,教授问的问题是:“你如果不是一个导演,你会去做什么?”有人说当木匠,有人说当画家。其实我最感兴趣的是接我爸的那个厂子。然后教授就说,其实那个就是你的电影。


👦🏻 Koji


就你最想过的人生,可能就是你最适合拍的电影。


🧑🏻‍💻 凯文


电影不是一个东西,它是一个载体,一个封装器。很多学电影的人会以为热爱电影本身就足够拍一个电影,但它只是你对生活的一个理解。


我觉得现在做 ChatCut 是我现在需要做的事。


电影,你看侯孝贤,我可以到那个年龄的时候再去做那个事。


👦🏻 Koji


好的,谢谢凯文。


也祝福 ChatCut,希望可以越走越好,状态可以一直保持在 9 分。


🧑🏻‍💻 凯文


谢谢Koji,谢谢十字路口。


文章来自于“十字路口Crossing”,作者 “十字路口Crossing”。

关键词: AI新闻 , AI剪辑 , ChatCut , 李凯文
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。

视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/

项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file


2
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

3
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

4
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

5
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

6
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0