图片来源:Youtube
“Super Charge Your Business with Premium Quality Akool Contents!”
“用优质的 Akool 内容为您的业务赋能!”
当我们看到 Akool 这个标志性口号的时候,就能意识到它的与众不同。
总部位于加利福尼亚州圣克拉拉,成立于 2022 年的 Akool 并不是所在赛道的“老前辈”。根据 Z Potentials 自己的统计,Akool 甚至可以被视作“新生代”的 AI 公司。
在 2022 年,随着生成模型(如 Stable Diffusion)和语言模型的快速发展,Akool 的创始人吕家俊意识到视频内容生成领域存在巨大的市场空白。他最初将公司定位于安全与监控领域,但很快转向专注于视频编辑与生成,因为这一领域更具商业价值且需求增长迅速。
同时,与相同赛道的 Synthesia 等友商的区别是,Akool 专注于高端企业客户和寻求个性化营销解决方案。而选择专注于 B 端市场的原因,则是企业客户需求复杂但支付意愿更高。吕家俊认为,通过为企业提供高效、智能的视频生成解决方案,可以实现更大的商业回报。这种策略也帮助 Akool 在竞争激烈的市场中找到差异化定位。标志性的财富 100 强品牌使用 Akool 的平台提供工作室品质的数字内容工具,例如换脸、AI 生成的头像和图像创建。这带来了无与伦比的参与度、品牌忠诚度,并显著提高了投资回报率。
“我们一直在寻求改进我们的产品并添加新产品。”吕家俊对高技能团队的坚定信念使他坚信 Akool 的道路可以带领它成为一家价值数十亿美元的企业,重塑数字内容创作的全球格局。
图片来源:CBinsights
在 Akool 的首页,你可以看到多达 12 个功能强大的 AI 工具,每一个都有高超的水准和独特的应用场景。
图片来源:Akool
1. 上传照片或视频,一键换脸
Akool 最强大的功能便是它的 AI 换脸(Face Swap)功能。你可以上传任何一张图片或一段视频,并且选择需要被换脸的素材。不到半分钟,一段与之前极其相似的新视频就出现了——当然,视频的主角已经变成了另外一个人。以下是 Z Potentials 在测试时所用的原版素材。
为了测试换脸效果,我们在 Google 上找了一张还算体面的埃隆马斯克的照片,喂给了 Akool。
图片来源:Google
以下是 Akool 换脸的生成结果:
有趣的是,Akool 还支持在换脸的同时更改对象的年龄。以下是“马斯克”版的“奥本海默”,左图是年轻了 30 岁的马斯克,而右图则是年长了 30 岁的他。
2. Live 动态即时换脸
在最新的版本中,Akool 可以做到对于实时输入的内容进行即时的处理,最终达到 Live 换脸的程度。想象一下,著名音乐人 Eminem 留着一头长发,在一对一的直播中向你比耶。这就是 Akool 的魔力。
图片来源:Youtube
3. 定制数字人形象与声音
与 Deepbrain、Synthesia 和 Argil 等同类产品类似,Akool 也提供可供定制的数字人形象与声音
你可以通过上传视频、图片,甚至是仅仅靠描述的方式生成你的数字人形象。
在声音定制方面,Akool 提供了数量无比庞大的选择。我们选择了中文方言作为测试。
视频中表达的内容是:“你好,这里是 Z Potentials,今天我们来聊聊 Akool。”可以看到,虽然不能在中英文中自由切换,但Akool 生成的数字人在语言表达的流畅度、口型的契合度、肢体动作的协调性等方面的确达到了很高的水平。
那么,Akool 与其他提供 AI Avatar 公司的产品究竟有什么样的区别呢?下面的几个对比视频会给你答案。
从对比视频可以看出,Akool 的数字人质量更好,在口型契合度、动作多样性与行为连贯性等方面均更胜一筹;以及Akool 有更好的面部、手势表现和肢体表现。
4. AI 视频编辑器:Akool 内嵌的“剪映”
Akool 的 AI Video Editor 功能给我们一种似曾相识的感觉。与 Pr 的专业面板不同,Akool 的视频编辑器更像是内嵌了一个“剪映”。下图是这个功能的界面。
而以下是剪映的界面。
可以看到,Akool 并未如 Argil 一样将 AI 生成图片和视频片段等功能加入自己的视频编辑器,而是在基本保留了剪映功能的基础上,加入了可以调用自己在 Akool 生成的其他素材的选项。这一部分并非其主要卖点,而是保证用户可以在 Akool 上完成全部视频制作过程的一环。
5. 会说话的 ChatGPT——Streaming Avatar
如果 ChatGPT 活过来会是什么样?它至少首先是 Akool 的 Streaming Avatar 的样子。Akool 结合了自己生成数字人的优势与大语言模型的能力做出了这个功能。在 Z Potentials 的测试中,我们让 Akool 的数字人对比 Chatgpt 和 Claude 两个大模型,它给出了令人信服的答复。这表明 Streaming Avatar 不仅仅是一个能回答简单问题的问答机器,而是可以进行深度对话的、有具体形象和特殊音色的“人”。
6. 视频翻译促进本土化交流
Akool 另一个有趣的功能是将视频转化成另外一种语言。这有助于不同文化不同语言的人们进行相互交流。
以下是 Open AI CEO 山姆奥特曼一段采访的中文版本。
7. 图片生成与图片背景替换
与 Midjourney 类似,你也可以在 Akool 上生成所需的图片,并修改你上传照片的背景。值得注意的是,在下图 Akool 提供的例图中,我们可以看到效果极佳的产品宣传图,这也体现了 Akool 希望向作为潜在客户的企业展示他们产品的应用场景。
8. 数据检查
许多企业都面临着数据筛选和事实核查的问题,而 Akool 的 AI 能够帮助企业解决这个问题。
9. AI Agent 接管人类客服工作
Akool 强调其 AI Agent 可以实现 AI 聊天(提升任何平台上的交互质量和用户体验)、AI 搜索、AI 用户流失控制和协助人类 Agent 更功能,个性化无缝解决客户问题,增强客户对产品的理解,并提高试用转化率。
对于以上我们看到的 Akool 种类繁多的功能,我们个人可能会觉得无从用起。但是正如我们第一部分提到的,Akool 从来就不是一家着重面向广大消费者的公司。其 Face Swap 使企业能够快速修改视频或图像,而无需重新拍摄,从而节省时间和成本;视频翻译可以打破语言障碍,使公司能够为全球受众本地化内容;逼真的 Avatar 和会说话的照片促进了个性化交流;它在输出中优先考虑电影级质量,提供 8K 图像分辨率和每秒 4 帧的 60K 视频,确保企业可以创建与目标受众,产生共鸣的视觉上吸引人且专业的内容;为了满足企业工作流程,Akool 与现有工具无缝集成,并提供团队工作区等协作功能,允许分布式团队实时共同创建内容,从而提高工作效率和创造力。
是的,Akool 是一家特点鲜明的 ToB 公司。
作为一名 AI 工程师,Akool 的创始人吕家俊有着辉煌的经历。他拥有浙江大学的学士学位和伊利诺伊大学香槟分校(UIUC)的计算机科学博士学位,专注于图形学和机器学习领域。作为《Enhanced Human》一书的著名作者,他获得了人工智能公司 50 强 CEO 奖。
在职业经历的早期,他供职于 Apple 和 Google,积累了丰富的技术经验,参与了包括 Face ID 开发和视频处理等多个前沿项目。在这些科技巨头任职期间,他认识到人工智能的前景广阔,特别是在创新营销和广告创作者以及具有前瞻性的全球品牌的内容创作领域。他试图解决一个主要问题:营销人员和广告商正在用信息轰炸消费者。产品信息没有为他们提供沉浸在品牌中的机会,让他们感到参与和投入,而是将产品信息强加给他们,使整个广告和购物体验完全无聊。借助 Akool,营销创建者和创新者可以构建定制的、引人入胜的体验,以将人们转化为忠实客户的方式将人们吸引到品牌内部。
图片来源:Akool
“实现最高质量的以人为本的品牌体验。这就是 Akool 的魔力。”吕家俊说。他的公司专注于使用 AGI(通用人工智能)技术为企业提供工作室品质的内容和数字化解决方案。他们的主要产品 Akool Cloud 采用复杂的 AGI 平台轻松生成优质品牌产品描述、标题和图像,以及创建具有文本到视频动画和画外音功能的个性化、引人入胜的产品视频。通过这些尖端解决方案,Akool 使企业能够更有效地接触和吸引客户,最终提高销售额。该公司已与超过二十万名创作者的庞大用户群建立了合作伙伴关系,并与两千多家知名企业合作,其中包括苹果、可口可乐、麦当劳、LG U+和 Shinsegae 等主要行业参与者。
吕家俊坚信,挑战是磨练解决问题敏锐度的熔炉,对于解决后续障碍非常宝贵。它们还帮助一个人培养情绪弹性,这对于继续成长是一个人所必需的。“我们创业的最初几天充满挑战,”他回忆道。“我们不得不身兼数职,兼顾客户会议、编程,甚至管理财务。” 然而,他们没有屈服于这样的考验,而是选择面对它们。每一种促进销售或吸引客户的数字资产都激发了吕家俊和他的团队的决心。作为 Akool 的首席执行官,吕家俊负责监督众多运营,确保整个公司的无缝管理。如今,Akool 作为一家全球性企业蓬勃发展,为全球各种创新企业提供突破性的生成式 AI 平台,用于个性化视觉营销和广告。
吕家俊为崭露头角的商业名人提供了变革性的见解:“找到你喜欢的事情,在你的旅程中招募合适的人,你会惊讶于这两件事能带你走多远。”他的智慧强调了当真正的热情与拥有共同愿景和互补技能的集体相结合时,就会出现巨大的潜力。这是一个充满活力的组合,能够推动人们超越传统界限,取得前所未有的成就。
参考资料:
[1]Dealroom, Akool, https://app.dealroom.co/companies/akool/analytics
[2]Youtube, AKOOL vs. Synthesia Avatars, https://www.youtube.com/watch?v=F9H7aCjo-jM&ab_channel=AkoolInc
[3]Youtube, AKOOL vs. Deepbrain AI Avatars, https://www.youtube.com/watch?v=gpxBwkv-J2I&ab_channel=AkoolInc
[4]Youtube, How To Face Swap Video With AI - Deepfake Tutorial - Akool, https://www.youtube.com/watch?v=k45i2k6SMco&ab_channel=KingyAI
[5]CIO News, Dr. Jiajun Lu: Leading the AI Revolution with Immersive Brand Experienceshttps://cioviews.com/dr-jiajun-lu-leading-the-ai-revolution-with-immersive-brand-experiences/
[6]Akool, About Us, https://akool.com/about-us
[7]Akool, https://akool.com/resource-type/case-study
[8]Youtube, AKOOL: High Quality Face Swap and Avatar Creation for Business and Fun, https://www.youtube.com/watch?v=guNXNO82b3s&ab_channel=BobDoyleMedia
[9]Pr Newswire, AKOOL Research Celebrates Two Paper Acceptances at NeurIPS 2024: Advancing Generative AI for Real-World Solutions, https://www.prnewswire.com/news-releases/akool-research-celebrates-two-paper-acceptances-at-neurips-2024-advancing-generative-ai-for-real-world-solutions-302329662.html
[10]Pr Newswire, AKOOL Unveils Revolutionary Web-Based Real-Time Face Swap and Advanced Streaming Avatar Features, https://www.prnewswire.com/news-releases/akool-unveils-revolutionary-web-based-real-time-face-swap-and-advanced-streaming-avatar-features-302189218.html
[11]Pr Newswire, AKOOL Announces Strategic Collaboration with Tata Consultancy Services to Drive Global Innovation in AI-Driven Marketing, https://www.prnewswire.com/news-releases/akool-announces-strategic-collaboration-with-tata-consultancy-services-to-drive-global-innovation-in-ai-driven-marketing-302224463.html
文章来微信公众号“Z Potentials”,作者“Z Potentials”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales