图片来源:Palabra
一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎,致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。
如今,LLMs 使文本语言转换变得更容易,但 Reddit 联合创始人亚历克西斯·奥哈尼安指出,语音翻译并非如此简单。
奥哈尼安表示:"AI 可以生成内容和翻译文本。但[语音]翻译是个独特难题,因为它需要实时语言切换,同时声音还需保持拟人化。"
奥哈尼安及其风投公司 Seven Seven Six(776)认为 Palabra AI 可能解决这一难题。因此该公司领投了这家初创企业 840 万美元的种子前轮融资。
本轮参投方还包括 Creator Ventures 及多位个人投资者,如 Instacart 联合创始人马克斯·穆伦、a16z 前合伙人安妮·李·斯凯茨、DeepMind 前产品主管迈赫迪·吉萨西以及纳马特·巴哈拉姆。
Seven Seven Six 的奥哈尼安特别强调,Palabra 在产品执行与团队专业性的双重优势促使他们决定投资。
“Palabra 的翻译层运行非常流畅。该公司拥有一支强大的 AI 研究团队,在语音领域做了高质量的工作。此外,这家初创公司在产品设计和输出质量方面也做出了出色的选择,”他补充道。
Palabra 由 Artem Kukharenko 和 Alexander Kabakov 于 2023 年创立。曾担任三星机器学习工程师的 Kukharenko 表示,他作为数字游民曾在多个国家生活,遇到过语言障碍问题。因此他希望结合自己的机器学习经验来解决实时翻译难题。
首席执行官ARTEM KUKHARENKO
图片来源:Palabra
"许多其他公司都曾尝试解决翻译难题。但当他们将语音转文本、文本转语音等 API 与翻译技术结合使用时,延迟时间就会增加,翻译效果无法实现真正的实时性。而通过 Palabra,我们成功将延迟降至 800 毫秒,使翻译过程流畅无缝,真正实现实时翻译。"他在电话采访中向 TechCrunch 表示。
Kukharenko 补充道,该公司已构建了一条定制化数据管道,使这家初创企业能在数周内轻松新增语言支持。他表示在管道末端,Palabra 会安排人工译员对输出质量进行校验。该初创公司称其算法还能适应嘈杂环境和对话中断等不同场景。
Palabra AI 同时提供面向消费者和企业的翻译产品。该公司推出的桌面应用程序兼容 Mac 和 Windows 系统,可与 Google Meet、Zoom、Discord、Slack 及 Microsoft Teams 等主流视频通话软件协同工作。该应用支持超过 30 种语言的实时互译,用户可选择以目标语言收听对方的母语发言,这一功能在多国籍参与者通话场景中尤为实用。
Palabra 官网表示,其桌面应用即将为 YouTube、Netflix、Twitch 和 Vimeo 等内容网站提供原生翻译功能。
用户每月可免费获得30分钟翻译时长。如需更多额度,可订阅每月25美元起的套餐,获得60分钟跨应用翻译时长。
该初创公司向企业提供 API 和 SDK,以便将翻译功能集成至其产品中。
目前其技术已为Agora 等视频平台提供实时多语言流支持。此外,GIS Group 等语言服务提供商正将 Palabra 工具与人工翻译结合使用。该公司表示,多家活动主办方也采用其技术提供多语言流服务。
Palabra 在翻译市场面临激烈竞争。在消费者端,像 Y Combinator 投资的 EzDubs 这样的初创公司正在开发适用于面对面或电话对话的应用程序。今年早些时候,谷歌也推出了 Meet 视频通话的实时翻译功能 。在企业端,像迪拜的 Camb.AI 这样的初创公司正在开发多语言直播活动翻译技术。
为了脱颖而出,Palabra 目前正在开发新的流式预测模型,有望大幅降低延迟。该公司还致力于支持超过 10,000 个同步音频流的翻译处理。
参考资料
https://techcrunch.com/2025/08/14/ai-translation-tech-palabra-gets-backing-from-reddit-co-founders-venture-firm/
文章来自于微信公众号“Z Potentials”。
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales