
你有没有想过,为什么今天全世界只有 2000 万开发者能决定我们所有人使用什么样的软件?这个数字听起来很荒谬,但确实如此。想象一下,如果只有 2000 万人能拍视频、写文章、创作音乐,互联网会变成什么样子?我们不会有 YouTube 上那些古怪的拆箱视频,不会有 TikTok 上那些脑洞大开的创意,也不会有无数普通人通过创作改变自己人生的故事。软件开发的世界正是如此:高度集中,被少数人垄断,而绝大多数人只能被动地使用别人设计好的应用。但这个现状可能即将被彻底改变。
Replika 创始人 Eugenia Kuyda 刚刚推出了她的新项目 Wabi,并获得了 2000 万美元的预种子轮融资。这个融资金额本身就很惊人,但更令人震撼的是背后的投资人阵容:AngelList 联合创始人 Naval Ravikant、Y Combinator CEO Garry Tan、Twitch 联合创始人 Justin Kan、Replit CEO Amjad Masad、Notion 联合创始人 Akshay Kothari、Neuralink 联合创始人 DJ Seo,以及 Conviction 创始人 Sarah Guo。这些硅谷最聪明的投资者为什么会集体押注这个项目?因为他们看到了一个足以改变整个软件行业的机会:让每个人都能像发 YouTube 视频一样轻松创建应用程序。Kuyda 把 Wabi 描述为"软件界的 YouTube",一个任何人都能用自然语言提示词瞬间创建迷你应用并与朋友分享的社交平台。这不是什么天方夜谭,而是已经在 beta 测试中吸引了大量用户、在 X 上引发热议的真实产品。
从 AI 伴侣到个人软件的远见
说起 Eugenia Kuyda,很多人可能还记得她在 2017 年创立的 Replika。那是在 ChatGPT 问世前整整五年,当时绝大多数人还无法想象与 AI 对话会变成日常生活的一部分。但 Kuyda 看到了这个未来,她创建了世界上第一个主流 AI 伴侣平台。今天,Replika 已经拥有 3500 万用户,证明了她对消费者 AI 趋势的预判能力。现在,她又一次站在了新浪潮的前沿,这次她看到的是个性化软件将成为常态的未来。
Kuyda 进入 AI 领域的起点可以追溯到 2012 年。那一年,她在 Google DeepMind 工作的朋友向她介绍了 word2vec 技术。这是第一个能够将单词转换为向量的技术,让计算机第一次能够真正处理语言。对于从小阅读维特根斯坦哲学著作的 Kuyda 来说,这个技术突破意义非凡。维特根斯坦有句名言:"我的语言的界限意味着我的世界的界限。"如果计算机能够学会语言,那就意味着它们能够理解世界,这将是人工智能的真正未来。当时 ImageNet 刚刚出现,图像识别模型开始涌现,但 Kuyda 坚信语言才是关键。于是她创办了一家专注于语言模型和对话生成的公司,尽管当时这个领域几乎没有任何研究论文或已知算法。

2015 年 8 月,Google 的研究人员 Quoc 发表了第一篇将深度学习应用于对话生成的论文。虽然他们没有公开任何模型,只展示了一些精心挑选的结果,但 Kuyda 和她的团队看到这篇论文后,立刻决定把公司所有资源都押在构建这些语言模型上。他们认为这个未来就在眼前,必须全力以赴开发第一个生成式 AI 聊天机器人产品。然而,这个"眼前的未来"实际上还要等七年才会到来。他们不得不苦苦支撑,一直等到第一批 Transformer 模型出现。这段经历让 Kuyda 学到了重要一课:有时候光看对趋势还不够,还需要有足够的资本和勇气去真正下重注。
2020 年,OpenAI 邀请 Kuyda 和她的团队去旧金山总部,成为 GPT-3 API 的首批合作伙伴之一。当时负责合作伙伴关系的 Mira Murati 和 Sam Altman 向他们展示了 GPT-3。Kuyda 回忆说,那一刻她完全震惊了。在此之前,如果想训练一个对话模型,你需要收集大量聊天数据,然后训练模型,而这个模型只能进行对话。但 GPT-3 是第一个零样本或少样本模型,它可以做任何事情,不局限于对话格式。你可以让它"像 Sam Altman 那样写一条推文"或"翻译这段文字",它都能完成。这种能力在当时看来简直是魔法。Replika 成为了 OpenAI GPT-3 API 的最大客户,因为他们是当时市场上唯一使用生成式 AI 的聊天机器人产品。其他大公司都害怕推出生成式 AI 产品,因为微软的 Tay 聊天机器人在发布后一小时内就变成了纳粹机器人,这个教训让所有人都变得谨慎。
在运营 Replika 的过程中,Kuyda 一直在观察用户如何使用 AI 工具。她发现一个奇怪的现象:虽然用户在使用 ChatGPT、Gemini、Claude 这些强大的工具,但他们主要只是用来搜索信息或帮助写作、做作业等简单任务。没有人真正在使用这些模型不断展示的那些令人兴奋的新能力。OpenAI 最近发布的研究也证实了这一点:三分之一的使用场景都是围绕写作或写作帮助。这让 Kuyda 意识到,问题出在界面上。当人们看到命令行或聊天机器人时,他们只看到搜索工具或写作助手。命令行的"可供性"决定了这些就是主要用例。必须有一个新的界面层,一个更具交互性、更视觉化、对所有人都更简单的界面,才能让人们真正发现这些模型已经具备的惊人用例。
从 DOS 时代到 Windows 时刻
Kuyda 和她的团队开始痴迷于一个比喻:当前的聊天机器人相当于 AI 界面的 MS-DOS 时代,而将会出现某种类似 Windows 或 MacOS 的时刻。这个比喻听起来可能有些夸张,但如果你仔细想想就会发现其中的深刻洞察。DOS 时代的计算机需要用户记住大量命令,只有少数技术人员能够熟练使用。Windows 和 MacOS 的出现彻底改变了这一切,图形界面让普通人也能轻松使用计算机,从而引爆了个人电脑革命。
困惑的是,现在的聊天机器人已经有巨大的用户基础。将近 10 亿人在使用这些 AI 工具,但他们只用于相对简单的用例。要解锁更多可能性,需要一个更令人兴奋的界面。这就是 Wabi 想要做的事情。它不是另一个代码生成工具,也不是开发者的辅助工具,而是一个真正面向大众市场的消费产品,专为非技术人员设计。
在 Wabi 上创建应用非常简单。你只需输入"帮我构建一个 AI 治疗应用"或"创建一个每日健身追踪器",平台就会立即生成一个功能完整的迷你应用。平台会处理一切:用户界面设计、数据库设置、图标创建,以及与 ChatGPT 或 Gemini 等 AI 模型的集成。用户永远不需要接触一行代码。Kuyda 在接受 TechCrunch 采访时说:"这真的是为了帮助那些与编程或科技世界毫无关系的人,能够非常快速地从日常生活中创建应用。你不需要擅长提示工程。你永远看不到代码。"

更重要的是,Wabi 不仅仅是一个开发工具,它还是一个社交平台。这是它与 Cursor、Lovable 等 vibe-coding 工具以及 Replit、Emergent 等无代码平台的关键区别。在 Wabi 上,用户不需要将应用发布到传统的应用商店,而是直接分享到社交信息流中,其他人可以点赞、评论和基于现有应用进行再创作。这个社交维度将 Wabi 从开发工具转变为社区创造和发现的平台。
长尾软件时代的到来
我一直在思考一个问题:为什么软件开发会被如此少数的人垄断?答案其实很简单,因为传统上开发软件的成本太高了。你需要雇佣专业开发者,而专业开发者的时间非常昂贵。对于那些用户规模不够大、商业模式不够清晰的小众应用,根本没有开发者愿意投入时间去构建。但现在,大语言模型的成熟正在改变这一切。
Gartner 预测,到 2025 年,超过 70% 的新应用将通过低代码或无代码方法开发,这主要是由开发者短缺和生成式 AI 的进步推动的。Wabi 正处于这一趋势的最前沿,但采取的是独特的消费者优先角度,而不是企业焦点。平台处理了应用开发的所有复杂性:数据库架构、后端基础设施和部署,让用户可以纯粹专注于创意层面。
我看到了一些非常有趣的用例正在 Wabi 上涌现。有人构建了一个励志名言应用,但它只从一个特定的电视节目中提取名言,因为创建者特别痴迷于那个节目,想在每天早上 5:30 起床时看到这些内容。Kuyda 自己构建了一个举重训练追踪应用,因为她发现应用商店里的健身应用都有太多她不需要的功能。她只想要一个简单的应用来追踪她的训练,而且要基于她正在阅读的一本特定书籍中的方法。于是她在去健身房的路上花两分钟构建了这个应用,现在每次去健身房时都会添加新功能。一开始只是一个追踪器,现在它能根据她的所有输入生成新的训练计划,考虑到她使用的健身房设施、她遵循的训练书籍、以及渐进式超负荷的阶梯技术。
更有趣的是,Kuyda 的女儿想玩猜谜游戏,于是她花两分钟构建了一个谜题应用,展示四张图片让女儿点击猜测。但女儿想要关于艾莎公主和茉莉公主的内容,所以她加入了这些元素。然后因为女儿上意大利语幼儿园,她又把应用改成意大利语版本来练习语言。整个过程非常简单快速,而如果去应用商店寻找这样的应用,首先不确定是否存在,其次即使存在也需要经过 15 分钟的入门教程、可能还要付费,最后还不一定符合她女儿的具体需求。
这些例子说明了一个核心洞察:存在大量的长尾需求,这些需求太小众、太个性化,永远不可能在传统应用商店中找到对应的应用。但对于有这些需求的人来说,能够快速创建一个完全符合自己需要的应用,价值是巨大的。这就像 YouTube 让普通人能够创作和分享视频内容一样,Wabi 正在让普通人能够创作和分享软件。
一个新的创作者阶层
Andreessen Horowitz 的合伙人 Anish Acharya 投资 Wabi 的原因非常清晰。他认为软件是"参与的最后前沿"。互联网一直是参与的驱动力,任何人都可以发表自己的想法。但很奇怪的是,互联网本身完全是由软件构成的,却只有极少数人能够创造软件。他相信我们正处于类似的转折点,就像 2006 年的 YouTube 一样。当时普通人看 YouTube,只看到业余舞者、音乐爱好者和家庭录像。但有远见的人看到了一个全新的互联网原生商业模式,让创作者能够绕过传统娱乐业的守门人。
Acharya 提出了一个他称之为"一次性软件"的概念。小型、灵活的应用程序,可以像打开新标签页或与 ChatGPT 快速聊天一样轻松地创建和丢弃。他说:"互联网已经变得有点临床化了,我们都在使用同样的 Instagram、同样的 TikTok,我们的主屏幕都一样,应用程序变得相当单调。我认为 Wabi 的机会在于,它将恢复一些朋克、奇怪、90 年代早期网络的精神气质。"

这个观点深深打动了我。确实,今天的互联网虽然连接了全世界,但在某种程度上变得越来越同质化。每个人都在使用少数几个大型平台,这些平台虽然功能强大,但缺乏个性和多样性。Wabi 代表的是一种回归,回归到互联网早期那种野性、实验性、个性化的精神。
Acharya 还指出了一个关键区别:视频内容会随时间衰减价值,但软件具有复合价值。如果有人构建了下一个热门应用,它会在很长时间内保持相关性。这意味着 Wabi 平台本身的价值也会随之增长。他预见会出现一种专业化元素,今天想成为 TikTok 明星的孩子们,未来可能会选择在 Wabi 上制作软件。他拿 YouTube 的历史作类比:"YouTube 一开始是人们上传这些摇晃的、低预算的内容体验。现在,20 年后,它的制作价值超级高。"
我认为一个新的创作者阶层确实会出现。健身网红可以创建展示他们健身方案的迷你应用,而不仅仅是发布视频教程。设计师可以创建他们独特风格的应用,即使功能相同,但人们会因为喜欢他们的审美而使用。小众兴趣社区可以围绕特定的应用形成,就像 Reddit 上的各种子板块一样。所有这些都建立在 Wabi 平台提供的社交图谱和共享基础设施之上。
为什么是现在
有人可能会问,既有 ChatGPT 的 GPT 商店,也有 Quora 的 Poe 机器人商店,Wabi 的差异化在哪里?我认为关键在于三个方面:用户体验的简化、社交层的整合、以及对移动端的重视。
在用户体验方面,Wabi 做出了一个重要决定:永远不向用户展示任何代码或技术术语。没有 API 密钥,没有"连接这个集成"之类的说法。虽然平台确实有集成功能,你可以添加应用和服务,但方式非常简单,只需说"使用我的 Apple Health"或"使用我的电子邮件"。他们称之为"power apps",这可能是用户会遇到的最技术性的术语了。Kuyda 说他们最关注的产品是 Canva,学习它如何让人们能够轻松创建漂亮的演示文稿。类似的事情需要在应用创建领域发生。
在社交层面,Wabi 本周刚刚向 beta 用户发布了社交功能,包括点赞、评论和重新混合任何现有应用的能力,以及查看用户个人资料以了解其他人喜欢、使用或构建了什么。Kuyda 强调:"社交层绝对至关重要,因为它允许更多的创造力和发现,这些迷你应用成为社区启动器或对话启动器。"这个洞察非常深刻。应用不再只是工具,而是社交的媒介,是人们连接和交流的方式。
在移动端方面,Kuyda 的背景几乎完全是构建移动应用,她深信很多事情你不会在网站或某个链接中做。需要有一个类似应用商店的组织层存在于移动端,浏览器是互联网的组织层,类似的东西应该存在于这个 AI 软件的新时代。她不相信人们会通过分享链接的方式使用软件,就像我们不是在某个地方看视频,而是在 Instagram、TikTok、YouTube 上看视频一样。她举例说,一些通过 vibe-coding 工具创建的约会应用已经登上应用商店榜首,但所有敏感信息都被泄露了,不是因为创建者是坏人,而是因为他们不是专业开发者。必须存在某个平台来托管这一切,提供必要的安全性和可靠性保障。
挑战与未来
当然,Wabi 仍处于早期阶段,面临一些挑战。我在测试时发现,创建基本应用很简单,但可能需要调试以避免错误,这在开发生命周期中是可以预期的。例如,我创建了一个每天展示狗狗图片和狗狗知识的应用,使用几天后发现它在生成相同的一组狗。另一个用户的每日新闻应用,所有摘要照片上提到的日期都是 2023 年 10 月 1 日,而新闻内容是几周前的,而且奇怪的是,其中一个新闻来源是维基百科。
Kuyda 承认这些问题,表示 Wabi 仍在早期阶段,他们还在解决如何确保应用开箱即用。她指出仍然存在模型限制,但这些限制每天都在改善。这就是为什么 2000 万美元预种子融资的很大一部分将用于扩建 Wabi 的产品团队。另一部分资金将用于有效补贴 Wabi 的使用,直到公司找到合适的盈利模式。
在盈利模式方面,Kuyda 的态度非常明确:她不打算在平台上投放广告。她从 Replika 的经历中学到,广告会创造导致暗黑模式的激励机制,破坏用户体验。她说:"我建立了 Replika,从来没有任何广告。我认为广告只会创造相当糟糕的用户体验。我喜欢创造令人愉悦的用户体验。"Acharya 相信一旦网络效应启动,盈利会很容易。他看到未来平台上会出现专业化元素,就像 YouTube 从业余内容演变为高制作价值内容一样。可能的盈利路径包括创作者订阅和收入分享。

关于硬件和未来界面,Kuyda 也有独到见解。她认为当前 AI 硬件领域存在一个巨大的思维陷阱:很多人认为语音是主要界面,是最终极的界面。这是因为他们总是在想电影《她》,但没有理解对电影的核心。是的,那部电影中的语音很棒,因为是斯嘉丽·约翰逊不断在主角耳边深情呼吸,那当然有效,你甚至不需要看到任何人。但如果真正思考语音界面,它们其实非常不完美。当有人在床上睡觉时你不能使用,在拥挤的空间不能使用,在办公室不能使用,甚至走在路上使用也有点奇怪。
她指出,现在 75% 的 Alexa 设备都配备了屏幕,因为即使是设置计时器这种典型的语音用例,人们也需要看到计时器,而不是每秒都问"还剩多少时间"。语音很难解决发现性和主动性问题。iPhone 上最糟糕的功能就是朗读推送通知和短信,这是一种非常缓慢的将信息输入大脑的方式。所以她认为最大的错误是制作无屏幕设备。她会做一个屏幕优先的设备,但不是语音驱动的,而是构建 AI 优先的操作系统,让所有模型在本地运行,构建真正的 AI 优先智能手机。不是今天这种以 CPU 为主的硬件,而是未来的硬件,有能在本地运行的模型,操作系统与今天完全不同,没有固定的应用,能够随时为你创建和修改软件,个性化程度比今天深入得多。现在 AI 只是手机上的一个应用,不应该是这样。
文章来自微信公众号 “ 深思圈 ”
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0