华人团队做的 OpenArt,在 10 人团队的情况下已经将 ARR 做到了 1600 万美金,其 CEO Coco Mao 陆陆续续分享了不少经验,这几点我觉得挺有价值:
早期,OpenArt 面临的问题是定位:在一个快速演进的市场中,如何找到自己的定位?当时的 AI 图像生成市场群雄并起——Midjourney 凭借其艺术化的输出赢得了设计师的青睐,DALL-E 以技术实力著称,而无数新创公司都在争夺这个看似无限大的蛋糕。
最初的几个月里,我们每天都在问自己同一个问题:OpenArt 与 Midjourney 或 Ideogram 有什么不同?说实话,在核心功能和技术层面,所有产品都非常相似。
从表面看,OpenArt 确实很难与竞争对手区分开来——都提供文本到图像的生成功能,都使用类似的 AI 模型,都面向创意工作者。但很快她意识到,真正的差异化往往不在于技术本身,而在于用户体验和使用场景的精准把握。
经过几个月的探索和用户反馈,OpenArt 团队确定了三个核心用户群体:
传统的 SEO 策略为 OpenArt 带来了一定流量,但增长曲线已经明显趋平。这时,Coco Mao 提出了一个大胆的假设:程序化 SEO(pSEO)可能是打破增长瓶颈的关键。
想法来自于她在 Google 搜索工作时的经验。比方说用户在搜索 AI 图像生成工具时,往往会使用非常具体的长尾关键词,比如"AI 动漫角色生成器"、"AI 外星生物生成器"等。这些搜索背后都有明确的意图,但当时市场上很少有产品针对这些特定需求进行优化。
2024 年 3 月,OpenArt 与 pSEO 公司 daydream 建立合作关系,daydream 团队帮助 OpenArt 识别出了一个具有巨大潜力的 pSEO 策略——创建针对特定主题的 AI 生成器页面。每个页面都遵循标准化的结构:
同时,daydream 不是简单地生成通用 AI 内容,而是:导入 OpenArt 自己的图像库数据,确保示例的真实性和多样性;结合 OpenArt 的内部知识库,生成符合品牌调性的内容;使用详细的、品牌特定的脚本指导 AI 内容生成。
从 2024 年 4 月开始的 8 个月内:创建了 600 多个 pSEO 页面,月访问量达到约 100 万次,让 OpenArt 在"AI 艺术生成器"相关搜索中跻身前 10 名。
到 2024 年底,OpenArt 已经在 AI 图像生成领域占据了一席之地,但她们意识到,随着 Ideogram、Playground AI、Craiyon 等竞争对手的涌现,AI 图像生成市场正变得极度竞争和同质化。CEO Coco Mao 在一次采访中说,
在一个由他人定义的品类中运营,意味着你只是众多玩家中的一个,可能还是较小的那个,我们的愿景是让 OpenArt 成为一个品类定义公司。
这个新品类就是视觉故事讲述。文本叙事已经实现了民主化——大多数人都能读写,任何有故事的人都能分享。但视觉叙事直到 AI 时代才开始真正民主化。传统上,创建视觉故事需要高昂的制作成本和专业知识,但 AI 正在改变这一切。
为了验证这个方向,OpenArt 赞助了 MIT AI 电影黑客马拉松。结果非常不错:一个由 5 名纽约大学电影学院学生组成的团队,仅用两天时间就创作出了接近皮克斯水准的短片——这在传统制作流程中需要整个工作室数月的时间。
其策略不是和 Sora、Pika 或 Runway 这些被她们称为"手动挡"的工具,而是专注于打造他们所说的"Uber 式"的解决方案。
所谓Sora/Pika/Runway = 手动挡工具,是指用户需要逐个生成片段,添加音频,管理各种元素,这种方式控制力强但需要大量工作;
而OpenArt 所采取的 Uber 模式,用户只需输入简单想法,系统自动完成脚本编写、故事板生成和视频制作。这里定位的核心是工作流程自动化。目前视觉故事创作流程通常包括:
1.脚本开发(通常使用 ChatGPT)
2.故事板生成(使用 OpenArt 等图像生成工具)
3.视频转换(将关键帧转换为视频片段)
4.后期制作(添加音效、音乐等)
OpenArt 的目标是将这个复杂的多步骤流程压缩为一个简单的输入→输出体验。
角色一致性问题是创作者面临的最大痛点之一。传统上,维持角色在不同场景中的视觉连续性需要复杂的变通方法。OpenArt 通过多模态集成组合多个开源工具做到了很好的效果,包括:
这种"乐高积木式"的架构让 OpenArt 能够快速适应技术进步,同时为用户提供端到端的解决方案。
OpenArt 的长期愿景是成为 AI 原生社交媒体平台的基础。当前阶段,他们专注于完善工具端的体验,但未来可能会探索更多互动式的内容格式——比如观众可以看到自己出现在视频中,或者在不同的决策点选择故事走向。
随着基础模型变得越来越强大,用户是否还需要中间平台?CEO Coco Mao 认为,如果仅依赖模型能力,当更好的模型出现时,用户可能会完全绕过平台。因此她将 OpenArt 定位为故事可视化的解决方案——用户在这里保存他们的角色、故事和模板——这样 OpenArt 在受益于技术进步的同时,仍然对用户有价值。
10 个人团队如何做到 1600 万美金的 ARR,Coco Mao 分享了她们采用的 AI 技术栈,如下图:
产品开发层面编程工具: Cursor, Windsurf我们的工程师根据个人偏好选择使用 Cursor 或 Windsurf。两者都能彻底改变大型代码库的工作方式——全局上下文搜索功能让团队成员不再需要费力查找他人编写的函数。我们这样的小团队得以专注于构建而非 Slack 讨论,从而支撑数百万月活用户。
测试工具: Checkly, StablyCheckly 用于监控关键后端接口,Stably 则通过 AI 驱动的端到端测试覆盖核心用户路径。这大幅减少了手动 QA 和 SRE 工作量,同时使生产环境更加稳定和可观测。
客户成功层面支持工具: Serif我们每天处理数百封支持邮件,传统方式需要 8 名以上客服。Serif 能自动生成 70% 以上的回复且无需修改。它会持续学习我们的语境和沟通风格,实现最小化人工干预的同时提供有温度的支持。
反馈工具: ClaudeClaude 直接集成在网站中,实时分析用户反馈和情绪。它能立即显示哪些功能需要更新、哪些设计让用户困惑、以及潜在漏洞的位置。
用户研究工具: Dovetail尽管团队精简,我们每月仍进行深度用户访谈。Dovetail 帮助快速梳理数十小时访谈内容,精准提取关键需求以指导产品方向。
内容审核工具: Cinder平台每日处理数百万张图片。Cinder 提供规模化审核工具,标记边缘案例、简化人工审核,在保障内容安全的同时不拖慢运营效率。
市场营销层面程序化 SEO: ChatGPT, OpenArt过去 SEO 极其耗时,现在我们建立 AI 驱动的工作流——每月产出数百个高质量页面(非垃圾内容),带来数百万自然流量。OpenArt 秒生成吸睛图片 / 视频,ChatGPT 撰写 SEO 优化文本,无需庞大内容团队。
SEM 广告: OpenArt, DeepSeek仅需 1 人兼职即可管理数百个广告活动。OpenArt 快速生成高转化素材,DeepSeek 撰写效果出众的广告文案(其语气控制能力远超其他大模型)。
网红挖掘: Beacons AI, GMass每次新品发布(每周超 2 次),用 Beacons AI 匹配契合度 90%+ 的网红。GMass 实现批量个性化邮件触达,单次可联系数十名创作者。
网红管理: Serif, MightyScout网红回复后,Serif 接管 1 对 1 对话并保持人性化语气。MightyScout 自动追踪帖子表现,让我们能专注关系建立而非后台监控。
YouTube 分析: VidIQ作为核心社交阵地,VidIQ 帮助我们挖掘热门话题、优化标题 / 缩略图、追踪视频表现。这套体系让我们在无专职团队情况下一年内订阅量从 0 增至 7 万。
文章来自于微信公众号“投资实习所”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。
项目地址:https://github.com/black-forest-labs/flux
在线使用:https://fluximg.com/zh
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0