四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作
6580点击    2025-12-09 11:04

几乎每一次普适性的技术革命都会带来内容生态的变化,AI 也不例外。


以视频生成为例,它正在把创作门槛降到一个不可思议的程度:过去需要拍摄、剪辑的内容,现在理论上只要有一个想法,就能让模型生成。


但变革背后还存在着最后一公里的问题:对很多有想法的人来说,当下的 AI 工具和制作平台存在着工具割裂、功能单一等问题,难以让想象力快速变成现实。


最近我接触到的一家公司——ArtArch,就是从破除这道阻力开始切入。


ArtArch 的创始人兼CEO黄严,创业前在字节智能创作部门担任工程与研发负责人,长期为字节全量业务线,比如抖音、TikTok、剪映、即梦、火山引擎等提供底层创作能力。这让他对"链路卡在哪"和"创作需要什么功能",有足够深的敏感度。


他希望做到的是,以工程能力为切口,创作一个场域,让全世界各种类型的创造者都能自由、丝滑地用 AI 落地想象力。


带着这个目标,今年年初,ArtArch分别完成了两轮融资,投资方包括锦秋基金、九合创投、BV百度风投。十月底,ArtArch 发布了自己的第一款产品——Skira。


四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作


Skira 分为 PC 和 App 两端。


App 目前主要提供内容浏览和 Remix 功能,普通用户只需要上传照片就可以 Remix 同款视频,“傻瓜式”完成创作。


比如,我在 App 中看到自己喜欢的万圣节视频,上传照片选择 Remix 后,很快就能获得同款。


四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作

*上传照片Remix


四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作

*上传一张蓝猫照片,Remix出的效果


四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作

*Skira中很受欢迎的「卢浮宫盗窃事件」


Skira 的 PC 版是面向制作人与技术流创作者的“AI 工作流乐高化”创作工具,能让更专业的内容创作者在一个创作平台里用到各类功能,打磨并发布内容。


四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作

*PC版创作后台


四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作

*PC 版完成制作,发布时可允许其他使用者修改自己WorkFlow参数


黄严告诉我,之所以让 PC 和 App 同时上线,是因为 ArtArch 的目标是把想象力变成真实的作品与可流通的价值。所以,Skira 设置为 PC 和 App 连通的模式,在 PC 端工作的创作者在完成创作后既可以发布到 Skira App 上,也可以分发至 TikTok、Ins 等平台。


目前,在 Skira App 端和 PC 端可 Remix 的模版,大多出自 Skira 的创作者。


这种机制,既能让专业用户的创意和玩法被更多人看到、消费,也能让 C 端用户拥有源源不断的玩法供给。等于不论创作水平的高低,所有人的想象力都能在这里流动起来。


四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作

*Skira 中可Remix的视频


在底层承载这些流动的,是 ArtArch 的想象力引擎。


这套引擎内置了 ArtArch 团队自己打造的编译器和编程语言,把多模态模型的能力、创作素材、工作流等内容,都封装进平台里,能让创作者像写剧本一样地定义工作流——这是 ArtArch 团队的核心能力。


这套引擎还可以高效创作爆款玩法。"要创作一个爆款玩法,很多人就算实现了算法链路,在工程上还要花很久,但我们打通了算法和工程,会比行业平均速度快几十倍。"黄严举例。


从这个角度,Skira 或许更像一个 AI 创意工厂,能高效发布创意,同时尽可能地让创意传播。


四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作

*Skira PC 工作台组装了很多功能


上线一个月以来,现在 Skira 已经吸引了一批全球化的创作者 KOC。黄严透露,目前他们有意控制了数量增长,因为质量是更被看重的维度。


一些正反馈是,有创作者利用 Skira 中的模板,在YouTube上从0起号获得单视频上完的万浏览。在不少 Skira 创作者的实操中,在社媒上看到视频的用户也会时常询问视频背后使用的工具。


四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作

*创作者用 Skira 制作视频,0粉起号获得3W浏览


四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作

*创作者在Ins上传播用 Skira 制作的视频


在完成引擎开发、Skira 产品上线、创作者和用户运营的小闭环之后,近期,我和黄严进行了一次交流。我们聊了聊他创业的初衷,Skira 背后的故事,和对AI时代内容平台的思考。


以下是交流实录:


四木专访|ArtArch 黄严:一年完成两轮融资的字节系创业者,想让全世界每个人都能AI Native创作


创造一个让所有人用AI表达想象力世界


Q:你之前在字节负责智能创作部门的研发与工程,为什么会忽然选择创业?


黄严:说实话,虽然我的上一份工作在大厂,但在学生时期,我就一直很向往创新创业。


可以先讲讲我的背景。我 2015 年北大硕士毕业,但实际上从 2013 年开始,我就作为第 5 号员工加入了格灵深瞳。当时能加入,也是因为和几个北大的同学做项目,拿了微软 Imagine Cup 全球大赛的中国区二等奖。我们那个项目叫“World Citizen(世界公民)”,愿景是用多语言翻译让世界各地的人实时聊天,同时做了一些视觉化的小玩法。


当时我们在北大遇到了格灵深瞳的创始人——勇哥(赵勇)。他看了我们的 demo,当场就把我们四个“打包”进了公司。我在格灵深瞳从早期做到上市前后,一共干了七年,把算法、后端、前后端、工程架构、大数据中心、机器学习平台做了个遍,但说实话,虽然那些年成长很快,但我始终知道自己更想做和“创意、想象力”相关的产品,就和学生时期做的项目一样。


所以在 2020 年,我加入了字节跳动。当时的组织最初叫 AI Lab,后来整合成“智能创作”部门。我在其中负责工程研发,是工程研发 Leader。


字节很多业务线的智能创作能力,底层都来自于这个部门。


我们会把创意创新的链路,不管是模型还是非模型、算法还是特效、剪辑还是渲染,全部工程化,变成 API、SDK、服务,供各业务线调用。


在字节的这段时间,我看到了创作从人工到AI强渗透过程,也和全球的产品、工程、运营一起协作,见到各种前沿玩法和全球内容趋势。


所以我很深刻地感受到,创作正在从“拍—编—剪”时代,变成“用想象力构建作品”的时代。这成为后来我创业的底层逻辑。


Q:AI 确实让创造的门槛变低了。在字节看到并感受这个趋势后,你认为 ArtArch 应该做什么?又为什么会有 Skira?


黄严:创作天然是发散的——它会不断生长,不断延伸。不过,创作的发散在技术层面不是无法收敛的,它可以通过一套技术框架来“陪伴式”地引导,而不是将创意和技术分成两条互不相干的管线。


这条收敛的技术管线,就是 ArtArch 的核心——想象力引擎。想象力引擎的核心作用是让越来越多的人用想象力就能进入心流式、丝滑创作的状态。


基于这套引擎,我们有了 Skira。Skira 的 PC 版更偏向专业的用户,App 更适合 C 端,看起来有点两套产品的样子,但本质上仍是一套。


Pro C,也就是专业内容生产者。他们有很强的制作能力,可以创作玩法、模板、效果。但发挥这些能力的工具还不够好用,甚至他们也会犹豫“不知道怎么用”,Skira 可以帮助解决这个问题。


第二类是 C 端创作者。很多人脑子里充满想象力,也想表达,但缺乏表达的“引导”。比如没有模板,他们会不知道如何让作品落地。所以目前,Skira 这套产品要做的,就是基于想象力引擎,让上述两类人都可以在 AI 时代,用更好的 AI 工具找到自己的表达。


Q:这个想象力引擎的具体形态是什么样的?


黄严:“想象力引擎”不是一个点状能力,而是一整条贯通创作前、中、后的系统化工程。随着 AIGC 爆发,传统的编辑、剪辑工具从主力变成辅助,AI 成为新的创意主引擎。真正的创作不是 prompt,而是大模型、多模态能力、工程化结构和创意逻辑的一体化协同。


我们把这套体系称为“想象力引擎”。它从底层架构到语言形态,都是从 0 到 1 自己搭建的。为了让创作真的像导演那样可控可构建,我们专门为创作设计了一门语言,一套编译器,以及可编排的工作流结构。创作者写下的是故事与意图,系统自动把它转成机器可执行的创作链路。


为什么要这么做?因为今天的内容创作还远远不够成熟。市面上很多“简单创作”——比如两个人拥抱一下、一个五秒钟 prompt 就能出一段视频,这些都只是碎片式的技巧展示,称不上完整的创作。真正的创作,从导演视角来看,是一个极其复杂的体系。


它包含人物、背景、时间、分镜,还有特效、转场、滤镜、花字,和素材系统。


只有把这些组合成完整的创作链条,才能产出真正能打动人的作品。


所以我们要构建一套创作语言,基于这套语言,脚本可以被转成可编程的结构,再与多模态能力结合,被自动化地“编排”成一次完整的创作流程,让AI的内容可以被用心构建。这才是我们所说的创作引擎。


同时,我们把 Agent 技术也接进来了。这样,市面上各种模型的能力、不同模态的能力,甚至你喜欢的各种创意手法,都能被拆解成“创作元素”,再快速拼成“玩法”和“模板”。


再换个角度,如果没有这套引擎,AI 创作就会非常人工。现在大家的典型工作流是:一个效果用即梦,另一个效果用可灵,静态图用 Midjourney,视频剪辑用剪映,文案再用 ChatGPT,脚本还得去别的地方写,整套流程要在不同工具之间来回切换,非常碎片化。


而我们做的,就是把这一切 all in one。让创作者只关注想象力,而不是工具之间的摩擦。引擎负责把分散的多模态能力收敛,变成可自动化的、可扩展的、可表达的创作流程。最终,创作者不仅能“模拟一个效果”,而是能表达完整的故事、节奏、风格和表达力。


所以,怎么真的把这么多创作元素组合在一起?怎样自动化?怎样用 AI 让它变得更高效、更有表现力?这一切都极度依赖底层,把多模态能力、模型与非模型能力,以及各种杂乱的创作资源整合、编排起来的这套底层,也就是引擎。


Q:基于引擎的心流式创作体验,可以举一些具体例子吗?


黄严:我们内部最喜欢的一个例子其实很简单:你在脑海里看到一场戏,只需要几句话,系统就能把它拆成一段完整的分镜大纲。


比如你说一句“一个小孩在雨里奔跑,突然抬头看到一条巨龙掠过天空”。传统流程里——编剧写一句、导演想镜头、分镜师画草稿、特效师做预演,各岗位要反复沟通。


但在我们的引擎里,它会自动生成这样的大纲:


镜头一:雨滴特写,落在鞋面,慢慢拉远

镜头二:孩子奔跑的跟拍镜头,略微抖动,带紧张感

镜头三:突然仰头,摄像机角度上摇

镜头四:巨龙从天空横切而过,光影掠过孩子的脸

镜头五:孩子表情特写,风吹起他湿漉漉的头发


更重要的,这些不是静态文字,而是可执行的创作节点,风格、角色、动作、运动轨迹、转场逻辑、光线、音效,全部能被组合并执行。


这种效果,以前就会 AE、Premiere 的专业创作者觉得,这比自己手动搭镜头快太多了。以前只会写故事、不会做特效的编剧老师会发现,原来自己也能做导演。


这就是心流式创作体验的意义:让有视觉的人可以更快落地表达,让没有技术的人也能拥有导演视角,人们不会被工具挡住想象力。


一个人可以凭想象力从 0 到 1 生成完整的作品雏形,再让引擎把所有复杂的技术细节自动化处理好。我们要做的,就是让创作者从繁琐的手工操作里解放出来,让他们只需要思考故事想讲什么、画面要表达什么、世界要长什么样。所有技术层面的摩擦,都交给引擎。


从引擎开始,构建AI时代的内容平台


Q:看到Skira的PC和APP端其实是可以连通的?它们的特点和关系是?


黄严:是的,它们是联动的关系。


Skira App 更 To C,是面向全球用户的“一键创作”玩法宇宙。Skira PC,是更面向制作人与技术流创作者的“AI 工作流乐高化”创作工具。有了它们,Skira 不只是一个应用,而是一套内容流动机制与创作者生产力系统。


等于,Skira 的整个模式从一开始就不是单边供应或单边消费,而是以“玩法”为中心的,供给—消费双向循环。


也就是,C 端需要专业创作者供给玩法,创作者的创意也需要 C 端用户去消化、使用、再表达。所以 Skira 天然是一种平台结构,PC 和 App 分别承载了平台的两端。


Q:除了 PC 端的创造链路,创作者为什么会更喜欢在 Skira App 上分发?


黄严:现在 Skira PC 端的作品,除了 Skira App,也可以发在 TikTok、Ins 上。


但我们在运营上也有自己的吸引力,能解决创作者的痛点。


不少具备创作能力的人,知道怎么做内容但不懂如何把内容有效分发出去——尤其是面向 C 端用户的分销。


很多创作者更偏向做中长篇内容,会通过 To B 的方式商业化,但这个领域竞争极其激烈,而 C 端用户本身并不会为这种“创意逻辑”买单。C 端不买单,就意味着必须依靠平台的运营,把用户留下来。


我们团队的成员大部分来自字节,对运营和爆款有着自己的 Sense 和经验。我们觉得,玩法才是链接创作者和 C 端用户的核心。因为围绕玩法,才能形成完整的创作型社区,我们能够判断什么方向的内容具有爆款潜质,也会设计商业化链路。这也是 Skira 之后会更吸引人的地方。


Q:现在 Skira 的专业和纯 C 端用户的数量大概是多少?


黄严:Skira 还处在一个增长阶段,我们不是很强调纯粹数量上的增长,更在意质量。可以透露的是,现在 Pro C 和 C 端用户的比例是1:10。


这也非常合理,因为海量用户肯定在 App 上。他们更喜欢简单、轻松地玩,用一个模板表达情绪,然后直接发布到社交媒体。所以,我们会把偏娱乐、偏消费侧的内容主要放在 App 上。


现在我们的 App 上还是最低门槛的功能,也就是一键Remix。但是之后我们也会稍微开放一些功能,让更多有创意的、但不需要更专业工具的人找到更多创作乐趣。这类用户叫 Author,也非常重要。


Q:比如 Sora App,有最"傻瓜"的玩法,也有一些创意功能可以让大家探索。似乎 Sora 出现后,Remix 的功能更火了。


黄严:Sora 带来了很多正向影响。因为 Sora 让大家意识到:除了传统的拍摄和剪辑,内容创作其实还有新的解法,并且观众也愿意看这种新模式下的内容。


有很多概念也因为 Sora 更被普及了。类似 Remix,但 Remix 是我们 Day 1 就在做的模式。我在字节时期做的“玩法”,本质上也是 remix。最近大家讨论二次元、讨论各种同款的内容,也确实都在说 remix。其实 remix 只是一种方式,是一个增长手段。这个概念最近才被普遍认识,但它一直存在。


但我想说,创作和传播的核心并不在是不是 remix 上。remix能不能火,还是要回到创作本质:比如模板本身有没有吸引力?它是否真正击中了某些用户的表达欲?它是否让人愿意点开、愿意玩?


Remix 只是一个入口,一个打开方式。真正决定作品生命力的永远是创作本身。


所以我们说,AI 能解决很多问题,但一定不能覆盖所有东西。创作者需要先把自己的 story 搭好,再基于 story 做玩法。只有这样,玩法才能真正击中用户,让他们愿意玩。


而 ArtArch 要解决的事,就是覆盖创作者最本质的想象力,让他们的创作维度更广、空间更大、可用元素更丰富。把这些功能都覆盖,再把工作流打磨更顺滑,让创作链路不被卡住,也有渠道分发,创作者就能更自由地发挥。


Q:Skira 现在有哪些运营策略?


黄严:举一些例子。首先,我们的 in-house 团队会持续做 showcase。很多强玩法、强示例最早都是由我们 in-house 团队亲自做出来的。我们会不断引入新的创作元素,提升玩法的复杂度、覆盖面,以及新颖程度,让整个生态的基础水位持续提升。


比如万圣节活动。我们把原始的模板给到各种创作老师,组织了一场带激励机制的比赛。


结果老师们创作出来的玩法,效果比我们内部做的好很多。


现在 Skira 生态里的老师们各自有自己的强项,有人擅长国风,有人擅长美漫,有人做梦核,也有人擅长写实类内容。当他们看到我们提供的创作手法,就会基于自己的专业积累产生新的想法和想象力。


为了让这些创意流动,我们会做引导 + 激励。


Q:在你的观察里,现在创作者核心在意的运营方式是什么?


黄严:其实对大多数老师来说,一方面他们有自己变现的通道,无论是商单还是教学,另一方面是希望自己的创意被认同,具有影响力。


有时候某些 KOC 发布玩法后,会吸引陌生人主动来问,这是什么 App 做的。这类“慕名而来”的情况其实挺多的,有创作者已经用我们的产品做内容,在 YouTube 上从 0 起号做到 3 万播放。


我们对于创作者的吸引力来自两个维度的叠加:


一方面,我们的工程体系把创作过程做到足够顺滑,让创作者的想法能够被完整表达。另一方面,我们的内容 Sense、玩法判断和激励机制,能够帮助创作者把作品“做准”,更符合用户的审美和接受方式。


从这个意义上,Skira 更像一个 AI 时代的创意工厂:创作是前半程,表达方式是后半程,两者缺一不可。


这也是为什么我们的创作者作品更容易跑出来。


但回到更本质的维度,我觉得真正能打动人的永远都是故事、想象力,不是技巧。我们能做的,就是用机器语言降低创意构建的复杂度,不论在哪个平台,创作永远是先击中自己,再击中朋友与粉丝的过程。


文章来自于“四木相对论”,作者 “四木相对论”。

关键词: AI新闻 , ArtArch , AI视频 , Skira
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0