10 人 1600 万美金 ARR，华人团队 OpenArt 用了这 11 个 AI 技术栈

10193点击 2025-06-30 16:23

华人团队做的 OpenArt，在 10 人团队的情况下已经将 ARR 做到了 1600 万美金，其 CEO Coco Mao 陆陆续续分享了不少经验，这几点我觉得挺有价值：

1.定位：如何找准自己的定位

早期，OpenArt 面临的问题是定位：在一个快速演进的市场中，如何找到自己的定位？当时的 AI 图像生成市场群雄并起——Midjourney 凭借其艺术化的输出赢得了设计师的青睐，DALL-E 以技术实力著称，而无数新创公司都在争夺这个看似无限大的蛋糕。

最初的几个月里，我们每天都在问自己同一个问题：OpenArt 与 Midjourney 或 Ideogram 有什么不同？说实话，在核心功能和技术层面，所有产品都非常相似。

从表面看，OpenArt 确实很难与竞争对手区分开来——都提供文本到图像的生成功能，都使用类似的 AI 模型，都面向创意工作者。但很快她意识到，真正的差异化往往不在于技术本身，而在于用户体验和使用场景的精准把握。

经过几个月的探索和用户反馈，OpenArt 团队确定了三个核心用户群体：

内容创作者：需要为社交媒体快速生成吸引人的视觉内容

奇幻爱好者：包括 RPG 玩家、动漫粉丝等需要个性化角色和场景的用户

中小企业：特别是营销机构，需要为客户创建各种类型的广告素材

2.增长：SEO 驱动的爆发式增长

传统的 SEO 策略为 OpenArt 带来了一定流量，但增长曲线已经明显趋平。这时，Coco Mao 提出了一个大胆的假设：程序化 SEO（pSEO）可能是打破增长瓶颈的关键。

想法来自于她在 Google 搜索工作时的经验。比方说用户在搜索 AI 图像生成工具时，往往会使用非常具体的长尾关键词，比如"AI 动漫角色生成器"、"AI 外星生物生成器"等。这些搜索背后都有明确的意图，但当时市场上很少有产品针对这些特定需求进行优化。

2024 年 3 月，OpenArt 与 pSEO 公司 daydream 建立合作关系，daydream 团队帮助 OpenArt 识别出了一个具有巨大潜力的 pSEO 策略——创建针对特定主题的 AI 生成器页面。每个页面都遵循标准化的结构：

H1 标题：AI [主题] 生成器

四个不同的示例按钮，直接链接到 OpenArt 的用户工作台

展示各种艺术风格的示例画廊

使用指南和提示词优化建议

同时，daydream 不是简单地生成通用 AI 内容，而是：导入 OpenArt 自己的图像库数据，确保示例的真实性和多样性；结合 OpenArt 的内部知识库，生成符合品牌调性的内容；使用详细的、品牌特定的脚本指导 AI 内容生成。

从 2024 年 4 月开始的 8 个月内：创建了 600 多个 pSEO 页面，月访问量达到约 100 万次，让 OpenArt 在"AI 艺术生成器"相关搜索中跻身前 10 名。

3.战略转型：从图像到视频

到 2024 年底，OpenArt 已经在 AI 图像生成领域占据了一席之地，但她们意识到，随着 Ideogram、Playground AI、Craiyon 等竞争对手的涌现，AI 图像生成市场正变得极度竞争和同质化。CEO Coco Mao 在一次采访中说，

在一个由他人定义的品类中运营，意味着你只是众多玩家中的一个，可能还是较小的那个，我们的愿景是让 OpenArt 成为一个品类定义公司。

这个新品类就是视觉故事讲述。文本叙事已经实现了民主化——大多数人都能读写，任何有故事的人都能分享。但视觉叙事直到 AI 时代才开始真正民主化。传统上，创建视觉故事需要高昂的制作成本和专业知识，但 AI 正在改变这一切。

10 人 1600 万美金 ARR，华人团队 OpenArt 用了这 11 个 AI 技术栈

为了验证这个方向，OpenArt 赞助了 MIT AI 电影黑客马拉松。结果非常不错：一个由 5 名纽约大学电影学院学生组成的团队，仅用两天时间就创作出了接近皮克斯水准的短片——这在传统制作流程中需要整个工作室数月的时间。

其策略不是和 Sora、Pika 或 Runway 这些被她们称为"手动挡"的工具，而是专注于打造他们所说的"Uber 式"的解决方案。

所谓Sora/Pika/Runway = 手动挡工具，是指用户需要逐个生成片段，添加音频，管理各种元素，这种方式控制力强但需要大量工作；

而OpenArt 所采取的 Uber 模式，用户只需输入简单想法，系统自动完成脚本编写、故事板生成和视频制作。这里定位的核心是工作流程自动化。目前视觉故事创作流程通常包括：

1.脚本开发（通常使用 ChatGPT）

2.故事板生成（使用 OpenArt 等图像生成工具）

3.视频转换（将关键帧转换为视频片段）

4.后期制作（添加音效、音乐等）

OpenArt 的目标是将这个复杂的多步骤流程压缩为一个简单的输入→输出体验。

4.技术：解决了角色一致性问题

角色一致性问题是创作者面临的最大痛点之一。传统上，维持角色在不同场景中的视觉连续性需要复杂的变通方法。OpenArt 通过多模态集成组合多个开源工具做到了很好的效果，包括：

Stability AI 和 Flux 用于模型微调

ElevenLabs 用于语音生成

Kling 和 Hailuo 用于图像到视频转换

这种"乐高积木式"的架构让 OpenArt 能够快速适应技术进步，同时为用户提供端到端的解决方案。

5.未来：从工具到内容平台

OpenArt 的长期愿景是成为 AI 原生社交媒体平台的基础。当前阶段，他们专注于完善工具端的体验，但未来可能会探索更多互动式的内容格式——比如观众可以看到自己出现在视频中，或者在不同的决策点选择故事走向。

随着基础模型变得越来越强大，用户是否还需要中间平台？CEO Coco Mao 认为，如果仅依赖模型能力，当更好的模型出现时，用户可能会完全绕过平台。因此她将 OpenArt 定位为故事可视化的解决方案——用户在这里保存他们的角色、故事和模板——这样 OpenArt 在受益于技术进步的同时，仍然对用户有价值。

10 个人团队如何做到 1600 万美金的 ARR，Coco Mao 分享了她们采用的 AI 技术栈，如下图：

10 人 1600 万美金 ARR，华人团队 OpenArt 用了这 11 个 AI 技术栈

产品开发层面编程工具： Cursor, Windsurf我们的工程师根据个人偏好选择使用 Cursor 或 Windsurf。两者都能彻底改变大型代码库的工作方式——全局上下文搜索功能让团队成员不再需要费力查找他人编写的函数。我们这样的小团队得以专注于构建而非 Slack 讨论，从而支撑数百万月活用户。

测试工具： Checkly, StablyCheckly 用于监控关键后端接口，Stably 则通过 AI 驱动的端到端测试覆盖核心用户路径。这大幅减少了手动 QA 和 SRE 工作量，同时使生产环境更加稳定和可观测。

客户成功层面支持工具： Serif我们每天处理数百封支持邮件，传统方式需要 8 名以上客服。Serif 能自动生成 70% 以上的回复且无需修改。它会持续学习我们的语境和沟通风格，实现最小化人工干预的同时提供有温度的支持。

反馈工具： ClaudeClaude 直接集成在网站中，实时分析用户反馈和情绪。它能立即显示哪些功能需要更新、哪些设计让用户困惑、以及潜在漏洞的位置。

用户研究工具： Dovetail尽管团队精简，我们每月仍进行深度用户访谈。Dovetail 帮助快速梳理数十小时访谈内容，精准提取关键需求以指导产品方向。

内容审核工具： Cinder平台每日处理数百万张图片。Cinder 提供规模化审核工具，标记边缘案例、简化人工审核，在保障内容安全的同时不拖慢运营效率。

市场营销层面程序化 SEO： ChatGPT, OpenArt过去 SEO 极其耗时，现在我们建立 AI 驱动的工作流——每月产出数百个高质量页面（非垃圾内容），带来数百万自然流量。OpenArt 秒生成吸睛图片 / 视频，ChatGPT 撰写 SEO 优化文本，无需庞大内容团队。

SEM 广告： OpenArt, DeepSeek仅需 1 人兼职即可管理数百个广告活动。OpenArt 快速生成高转化素材，DeepSeek 撰写效果出众的广告文案（其语气控制能力远超其他大模型）。

网红挖掘： Beacons AI, GMass每次新品发布（每周超 2 次），用 Beacons AI 匹配契合度 90%+ 的网红。GMass 实现批量个性化邮件触达，单次可联系数十名创作者。

网红管理： Serif, MightyScout网红回复后，Serif 接管 1 对 1 对话并保持人性化语气。MightyScout 自动追踪帖子表现，让我们能专注关系建立而非后台监控。

YouTube 分析： VidIQ作为核心社交阵地，VidIQ 帮助我们挖掘热门话题、优化标题 / 缩略图、追踪视频表现。这套体系让我们在无专职团队情况下一年内订阅量从 0 增至 7 万。

文章来自于微信公众号“投资实习所”。

关键词: AI , OpenArt , 文身图 , AI绘图

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT

Flux

【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目，该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目，效果堪比midjourney。
项目地址：https://github.com/black-forest-labs/flux
在线使用：https://fluximg.com/zh

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0