Plaud AI CEO 许高:全球出货近 70 万台设备背后,Plaud 想用 AI 重塑对话价值链

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
Plaud AI CEO 许高:全球出货近 70 万台设备背后,Plaud 想用 AI 重塑对话价值链
7457点击    2025-05-24 11:08

5 月 23 日,Plaud AI 创始人许高与《时代》杂志特约编辑 Charlie Campbell 在 Beyond Expo 展开了深度交流 —— 围绕“语音交互与人类智慧传递”、“生成式 AI 在工作流中的价值”、“个性化模型的演进”以及“AI 安全与地缘政治挑战”等多个维度展开探讨,还分享了 Plaud AI 在消费级 AI 硬件与人机协同方面的最新进展与长期愿景。


Plaud AI CEO 许高:全球出货近 70 万台设备背后,Plaud 想用 AI 重塑对话价值链


许高强调对话不是简单信息交换,而是“人类智慧”的传递。Plaud 不止做语音转文字,更关注如何把对话中有价值的内容提取出来,转化为摘要、待办事项、甚至思维导图,并通过集成 Salesforce、HubSpot、Epic 等工具自动流入工作系统中,助力整个流程自动化。


Charlie Campbell:


我是《时代》杂志特约编辑 Charlie Campbell。今天很高兴邀请到 Plaud AI 的 CEO 许高(Nathan Xu)。我们先从头说起,是什么激发你创办 Plaud AI 的灵感?自创立以来,公司愿景有怎样的演变?


许高:


我是第一次创业,但我长期以来也是一家技术公司的投资人。过去无论是作为创始人还是投资人,总是需要参加大量会议、进行许多对话。我总觉得很多讨论都非常有价值,充满了好点子。以前我会记很多笔记,但几乎永远赶不上节奏。而且有时候没来得及写下的点子,转眼就忘了,“那句好像特别有价值的话,到底是什么来着?”——这让我印象深刻。


时间回到 2021 年,我开始思考创业。当时语音转文字的技术已经相对成熟。比如谷歌就有一个叫 Live Transcribe 的 App,连通知栏都能实时转录,那时这个 App 的下载量已经超过 10 亿次。那还是 GPT 和大语言模型(LLM)问世前的时代。我就想,如果能做一个设备,提供一种直观、让人安心的笔记体验,让人们可以轻松录音,然后把音频转成文字,把那些重要信息完整记录下来,也许未来某一天,AI 可以真正派上用场。而从商业角度看,这个方向也很有潜力。当时这只是一个假设。


于是我们在 2021 年启动了公司,接下来的 12 个月主要都在做研发。直到 2022 年,我们发布了第一款产品 —— 一款智能录音器。当时还没有集成 AI。我们先验证了产品的市场匹配度。一旦验证成立,我们就知道,是时候把 AI 元素加入到设备中了。我们原本打算开始招聘 NLP 工程师,从长时间对话中提取关键词和关键信息。


但就在 2022 年 11 月,GPT 发布后,我立刻意识到:AI 笔记将是大语言模型最契合的产品场景。大语言模型本质上就是特别擅长从冗长、杂乱的对话中提取有价值、准确的文字内容。于是我们把这项功能加入到了我们的产品中。半年后,在 2023 年夏天,我们推出了新产品。


直到现在,我们已经向全球用户出货超过 60 万、接近 70 万台设备,实际上如果按体量来看,距离一百万台也不远了。我们正在帮助全球数十万用户每天记录他们的对话,也许每天能为他们节省一个小时的时间——无论是做笔记,还是记住对他们重要的信息。这让我们觉得,AI 真的是对人类非常有益的工具。


Charlie Campbell:


作为一名记者,我非常理解你在做笔记这件事上的“痛点”。我暴露年龄了,但我当年训练成为记者时,还必须学习速记,考试要求是一分钟准确速写 100 个单词,而且要用速记符号准确还原内容。幸好现在已经没有多少人需要这样做了。那么你怎么看,在 AI 的影响下,会议和信息记录方式发生了哪些变化?


许高:


AI 的时代吗?显然,人们最初是用纸和笔手写。我认为这是一种表达思想、自由构思的方式,比如你可以画图、连线、构建结构等等。


但人们不是单独工作,更多时候是协作,因此他们经常需要将自己的想法分享给他人。你想想过去几十年,像 Microsoft Teams、Notion、Google Workspace 这样的协作工具变得非常强大、高效,它们让人们更容易地记录想法,并把这些信息分享出去。这种方式其实是一种手动的流程:把脑子里的想法,或者是你听到别人说的内容写下来,然后共享出去。


但我认为人们一直低估了一件事,那就是:当我们彼此交谈时,交流的其实是智慧。这听起来有点抽象,所以我经常问别人这样一个问题:“我们现在在进行这场对话,你觉得我们到底是在交换什么?”很多人会说是在交换“信息”,这当然不完全错,但你仔细想想:如果我们只是交换信息,那我为什么不直接去看一本书?比如我去读《乔布斯传》,你去读《查理·芒格传》,这不就得了?但我们还是选择对话。


为什么?因为对话是我在表达我的思考,你在回应你的理解。这其实是“人类智慧”的传递。


有了这种“智慧”思维方式,我们就能更深刻地理解“智能”到底是什么。不只是说话,听和看,其实都蕴含着智慧。我们每天都和很多人交流,很多工作其实都是靠交流完成的。


回到“会议”这个场景。虽然现在线上会议技术已经很先进了,比如 Zoom、Google Meet 都可以提供会议记录工具,但你想想,无论是医生和病人、记者和创始人、政治家和选民、律师和客户之间的对话,几乎每一场谈话中都蕴含着大量的智慧,而我们此前并没有好好地捕捉它。所以我们现在打造的是一种工具,可以让人们轻松地录音,并从中提取智慧——我们把语音转成文字,再进一步总结成摘要、待办事项、甚至是思维导图,这些都非常实用。但这还不是终点。


我们对外的长期愿景是帮助人们 “捕捉、提取、利用” 智慧。想想我们作为专业人士是怎么工作的:我们和人沟通、再把好想法传达给同事,在 Notion 或 Slack 上发起协作任务,最后把事情完成。我们要做的是:不仅生成几百万条摘要,更要创建一整套协作功能。你可以轻松分享一段内容,比如输入对方的邮箱,对方就能接收到那段相关的内容。


同时我们也在打通很多 SaaS 工具,比如销售人员在使用 Plaud 的设备或 AI 时,我们可以通过 API 接入 Salesforce,自动识别你跟客户的对话内容,比如预算、车型偏好,然后直接把这些智慧输入到 Salesforce 系统中去。除了 Salesforce,我们还接入了 HubSpot;在医疗行业,我们也打通了 Epic 和其他电子病历系统(EHR)。


我们的终极目标是构建一张“智能高速公路”的互联网络。想象一下未来:数以亿计的设备在现实中帮助人们捕捉数据,再通过 AI 自动化地分享智慧、推进流程。这将极大提升整个社会的效率。


Charlie Campbell:


从手动转向数字化流程,确实能带来生产力提升,但也存在很多风险。比如现在 AI 给我总结邮件,有时我会发现它完全没有抓住重点,甚至总结错了。这种“不可靠”还是个很大的挑战。


许高:


是的,现在大家还处在“AI 有魔法”这种新鲜感阶段,觉得“哇,它竟然能帮我总结会议内容”。但更深层次的问题是:如何把“人的意图”准确地连接到 AI 所生成的内容上?


因为 AI 本身并不知道什么才是“重要的”,或者说它并不理解你对摘要的偏好。有人更关注数据,有人更看重事实,有人喜欢概括性的总结,有人则偏好详细的还原。


所以我们正在做的一件事是:如何让人和设备交互?比如你在对话中标记某句话“这个说得好”,设备就知道你认为这段内容很关键;或者你记录下几个关键词,AI 就能在对应的时间线上,找到那些关键词周边的上下文信息。这种“人机互动”将成为趋势,我们要做的其实是桥接“人工智能”和“人类智慧”。


Charlie Campbell:


那在专业场景中,AI 的使用有没有什么行业标准?比如 AI 帮我总结工作流程,那里面包含大量公司机密,也用于训练算法,所以需要确保安全性。有没有国家层面的标准?或者国际标准?


许高:


这是个很好的问题。我们才刚刚起步,就像是这个新赛道的“第一个发明者”,目前确实还没有明确的国家或国际标准。


我们现在的做法是:建议用户在开始录音前,务必告知并征得他人同意——这既是礼貌,也是符合法律的行为。同时,我们也在努力为每一位参与者创造价值,比如过去我们的摘要只针对设备持有者生成,但下周你就会看到一个新功能:Plaud AI 能够识别一个会议中三位不同角色的参与者,分别为他们生成专属摘要并发送给他们。这样一来,每个人都会觉得“我虽然被录音了,但也获得了有用的内容”,大家就更愿意配合。


至于未来的终极形态,我认为每个人都会拥有一个随身的 AI 设备,帮助他们捕捉说过、听过、甚至看过的内容。然后,这些数据将被用来与超强 AI 模型结合,形成一个超级智能系统,帮助人们更高效地完成工作。我们希望未来不是每天工作 8 小时,而是 4 小时就能搞定;不是每周工作 5 天,而是 2 天。


你可能会担心被录音会不舒服,但当大家都拥有这样的设备,而且合作效率大幅提升时,我们可能就会接受这一现实。而企业主们肯定也乐于看到这种效率的提升。


所以我认为,未来肯定会伴随着争议,监管机构也会介入、设定标准。但我们会始终坚持做“对的事”、做“合法的事”,这注定是一场挑战,但我们愿意承担。


Charlie Campbell:


我想确实就像手机摄像头的普及或 CCTV 的无处不在一样,大家一开始会不习惯,但最终会适应随时可能被录音的现实。这可能就是新的“常态”。但现在已经有很多语音转录工具了,Plaud AI 和市场上其他产品相比,有什么独特之处呢?


许高:


我想首先要说,我们是目前唯一一个能够如此出色地从现实生活互动中捕捉数据的解决方案。你可能会想,智能手机的应用程序也可以录音,甚至笔记本电脑也可以做到。但即使我们已经拥有最先进的手机和笔记本电脑,我们日常生活中并没有真正去记录这些音频。想想看,我们录下的谈话内容只占我们实际说话内容的一小部分。而正如我们所讨论的,其中蕴藏着大量的智能信息。


所以我认为,通过我们开发的可穿戴 AI 设备,比如 Plaud Nodes、Plaud Pin,以及未来的 Plaud Air、Plaud Glass,我们将拥有越来越多的 Plaud 设备,可以让人们毫不费力地采集数据。而智能手机太“忙”了——它们要完成太多任务。但 Plaud 设备是专门设计来作为我们的伙伴,它负责数据的捕捉和处理,这是一个很大的不同点。


另一个方面是,我们在尝试打造个性化的 AI 体验。你看看整个行业,其实还处于起步阶段。其他公司更多地记录线上会议,而我们主要帮助人们捕捉线下数据,并提供转录、摘要服务。但我认为,我们需要进一步推动 AI 的定制化,比如引入强化学习(reinforcement learning)。


每次我生成一个摘要,我都会请用户评价它是好还是不好。用户只需要用几个词来描述他们是否喜欢这个摘要,甚至给出一些建议,让系统知道怎样的摘要会更好。模型就能根据这些反馈进行训练,逐渐形成为你个人服务的 AI 模型。你可以把它想象成我们雇了一个最优秀的助理,这个人非常了解你,而这正是 AI 未来需要进化的方向,我们也需要为此不断开发。


Charlie Campbell:


你是来自河北的中国人,公司却是在硅谷创立的。面对当下的地缘政治和科技紧张局势,你觉得这对你们的业务有没有带来影响?


许高:


这是我可能会担心的问题,但目前对我们来说还没有直接影响。我们做所有事情基本都基于第一性原理。这是一方面;另一方面是坚持做正确的事情,保持良好的初衷,无论面临怎样的地缘政治挑战。


比如我们主要服务的客户是在美国、日本和欧洲。如果你看我们的数据存储、云服务方面的工作,我们在旧金山有一个很大的团队,工程师们负责 SaaS、云解决方案、数据安全与合规等工作。我们也拿到了一些重要的认证,比如美国的 SOC 2,还有面向医生的 HIPAA 合规认证。


我们的思路就是投资正确的技术,就像微软和谷歌那样,达到世界级的安全标准。然后通过这些认证来为我们的品牌背书,让人们觉得我们的产品是安全的。同时,我们保持透明,积极和公众沟通。


当然我们在中国也有一个庞大的团队。你想做硬件的话,深圳的工程师们在设计、工程实现、制造最复杂、最先进硬件方面是最有能力的。我们能够把 Plaud 设备以每台 160 美元的价格销售给全球成百上千万用户。但如果因为政治原因我们被迫转到美国制造,那成本会升到 500 美元,甚至 1000 美元,这对人类是没有好处的。


所以我觉得我们必须放眼未来,希望有一天这些紧张关系会缓和。我们也必须承认,AI 最终可能带来如此之高的生产力,以至于每个国家都会变得更加富裕,我们也许会逐渐放下这种种紧张与对抗。



文章来自微信公众号 “ 有新Newin “,作者 有新


Plaud AI CEO 许高:全球出货近 70 万台设备背后,Plaud 想用 AI 重塑对话价值链

关键词: Plaud AI , Plaud , AI硬件 , AI录音笔
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
语音转录

【开源免费】Whisper是由openai出品的语音转录大模型,它可以应用在会议记录,视频字幕生成,采访内容整理,语音笔记转文字等各种需要将声音转出文字等场景中。

项目地址:https://github.com/openai/whisper

在线使用:https://huggingface.co/spaces/sanchit-gandhi/whisper-jax