Plaud 在国内与大厂们的「竞赛故事」仍在继续。
作者 : 镜山
编辑 : Koji
排版 : NCon
最近半年,一个原本很安静的品类突然变得热闹起来。
钉钉发布了 AI 录音硬件 A1,飞书联合安克推出了录音豆,深圳华强北更是涌入了一大批长得差不多的白牌录音卡片。
这一切,往往被大家归结于一个起始点:AI 录音品类的定义者 Plaud 在 2025 年 9 月 22 日宣布进入中国市场。
一个录音设备,过去在消费电子品类里存在感不强,突然就成了大厂和创业公司一起抢的大热门场景。
为什么?回答这个问题的切入点之一是:工具,究竟该为谁而造?用户到底需要什么?
钉钉和飞书给出了它们的回答,Plaud 给出了另一个。2 条路,指向的是 2 种完全不一样的未来。
接下来,将分享我们对这场 AI 录音硬件「围攻」的全面洞察。
AI 让一个沉睡的品类醒了过来
录音笔这个品类存在几十年了,一直是个边缘产品。
如果要往前数,Sony 的 Microcassette Recorder 可能会是个代表,从磁带录音笔到数字录音笔,这个品类走过了几十年,场景一直都非常垂直。
记者用,律师偶尔用,职场人有时开会用,学生期末复习的时候可能也用一下。除此之外,现在的大部分人买了录音笔,用不了几次就扔在某个角落里吃灰了。
原因很简单:光录不整理,等于没录。
一场 1 小时的会议,录完之后是一个 1 小时的音频文件,很少有人会重新完整听一遍,即便开了倍速,花掉的时间成本依然是「无法复利」的。明明开会的时候花费 1 小时录制,在事后进行信息整理的时候仍然要花掉相同、甚至更多的时间,去整理、复盘,这很诡异。
所以录音笔这个品类,一直卡在一个很尴尬的位置,采集能力有了,但后面那一整套「把信息变成可用的东西」的链条几乎就是断的。
AI 出来之后,这个链条被补上了。
2021 年底,Plaud 创始团队发现一个明显需求:会议、采访、电话等大量信息被记录但无法被有效利用。
于是,他们提出一个方向,从音频采集,到把数据结构化,最终到为用户沉淀专属的知识库。
2 年后他们推出了一款产品,成为了 AI 录音硬件最早的定义者。没错,这个产品叫 Plaud Note。
录完即转写,转写完即总结,总结完即归档。一场会议结束,3 分钟之内你就能拿到一份结构清晰的纪要,重点标注好了,待办提炼出来了,甚至可以按照不同角色的发言做拆分。
这个体验的变化是质变级别的。过去你需要一个实习生花 2 小时做的事,现在 AI,3 分钟做完,而且基本不会遗漏,大概率不会听错人名。
但 AI 的到来并不只是让「录音变好用了」,更深一层的变化在于:录音设备正在从一个「记录工具」变成一个「数据入口」。
今天,人们在互联网上留下的行为轨迹越来越多。无论是点过的赞、搜索过的关键词,还是发送过的信息,都会在数字世界中留下记录,并不断被整理和利用。
但一个人每天面对面说的话、跟客户聊的电话,跟团队碰的方案,跟合伙人的讨论,这些信息量可能比一天打的字多 10 倍以上,但绝大部分从未被留存过,也很难被留存。
这些对话中蕴藏了大量的信息和思考,于是,将这些信息、决策、思考进行捕捉、提取、运用成为了 Plaud 的产品初衷。
线下真实对话中的信息,是一直以来最大的一块数据盲区之一,尤其是对于「三高用户」(高决策杠杆、高知识密度、高对话依赖)来说,这种「离线数据」是非常重要的。Plaud 作为这个品类最开始的「定义者」看重的正是这个逻辑。
另一方面,大厂嗅到了这个机会。AI 能力到位了,硬件成本在降低,而线下信息的数字化入口摆在那里,谁先占住,谁就多了一个跟用户建立深度关系的通道。
AI 能力成熟后,线下信息作为入口有了商业价值。
所以钉钉做了,飞书做了,还有更多的厂商都在下场。
但问题来了,虽然大家都涌进了同一个赛道,每家的打法和意图却完全不同,那背后的逻辑到底是什么?
同一个赛道,2 套完全不同的底层逻辑
钉钉和飞书做录音硬件这件事,如果你只看产品发布会,会觉得它们跟 Plaud 做的是同一件事。都是一个小卡片,都能录音,都能 AI 总结。
但仔细看一下,就会发现它们出发点是完全不同的。
钉钉本身是一个企业协同平台。上面跑着大量职场人的会议、审批、日报、项目管理。飞书也一样,字节内部长出来的协作系统,天然就带着「组织效率」的基因。
它们做录音硬件,逻辑很顺:自家平台上每天有海量的会议在发生,如果能用一个硬件设备把这些会议的信息采集得更完整、流转得更顺畅,那整个协同生态就补上了一块拼图。
所以你会发现,钉钉的录音硬件 A1 跟钉钉的会议系统是打通的,安克和飞书合作的录音豆也是直接接入飞书的纪要体系。
录完的内容自动归档到对应的会议记录里,参会人都能看到,待办自动分发,所有的文档都能延伸到更多的「大厂场景下」。
谁来用这个设备?是组织里的每一个员工。使用场景也往往很集中:会议、留痕。
这套打法是很清晰的,用硬件强化已有的会议生态,用录音数据让组织内部的信息流转更完整。本质上,这是一个「让管理更高效」的故事。
不过,从最一开始,Plaud 走的就是另一条路。
它从第一天开始,就没想过要接入谁的生态。因为,它要服务的对象很明确:个体优先。
更具体一点,是那些每天高度依赖对话来工作的群体。
像我们上面所说的「三高用户」(高决策杠杆、高知识密度、高对话依赖)是非常典型的群体,他们都有一个共同特征:工作本质就是「通过对话完成复杂任务」。
这类人群的第一类特征是:高决策杠杆。
很多人的工作是执行型的,比如填表、处理订单、完成流程。但「三高用户」不一样,他们的工作核心是不断做判断,并且这些判断会带来较大的影响,比如判断产品方向的创业者
第二类特征是:知识密度极高。
比如医生、投资、咨询,他们的对话中的信息含量非常高,但是聊完就过去了,很少被系统地整理和沉淀。
第三类特征是:工作通过交流完成。
很多行业的知识获取方式,其实不是文档,是人和人之间的交流。最典型的就是销售通过沟通理解客户需求。
对这类「三高人群」来说,他们真正需要的并不只是一个简单的录音工具。
一个能把对话里的高密度信息变成结构化内容的助手,能把这些「离线数据」整合、复利,才是最被看重的。
这也主要是因为这些「三高人群」的使用场景远远超出「开会」这一个框框。他们在咖啡馆聊业务,在出租车上打电话,在诊室里问诊,在法庭外面跟当事人对接。这些场景有一个共同点:手机不方便拿,但对话里的信息密度极高。
一个随身携带的独立录音设备,在这些场景里的价值明显比手机录音靠谱得多,不会被来电打断,不会因为切了个 App 就停止录制,也不需要你一边聊天一边分心操作。
而且 Plaud 刻意保持了平台中立,它不绑定任何一家的生态。
这一点在海外市场特别有吸引力。美国一个职场人可能同时在用 Slack 沟通、Google Docs 写文档、Salesforce 跟客户、Notion 做知识库、Zoom 开会。
如果你让一个人把所有数据跟某一个平台绑定,可能会比想象的太困难。
所以回头看,钉钉、飞书和 Plaud,底层逻辑是完全不同的。
一个绑定的是组织系统。虽然大厂的 AI 录音硬件也可以把内容导出来,再转到其他社交或效率工具里用,但这些信息一旦离开了自家的组织体系,用起来大概率没那么顺手。数据、权限结构、协同,都是围绕那套生态设计的。所以换一家公司,很可能就得换一套工具。
一个绑定的是个人工作方式,Plaud 用户所有的数据都会沉淀为一个专属的知识库,只要产品还在一直用着,未经过你本人的授权或删除,数据就会一直在私有云里。
总的来说,一个是「让组织中的个人更有效率、组织更协调」,一个是「让个体想得更深」。
这两条路没有高下之分。
它们对应的是两种对 AI 工具未来的判断,服务的也是两类完全不同的人群。但有意思的是,如果你把视角拉远一点,会发现 Plaud 押注的那个方向,背后正在发生一些更大的变化。
时代在变,Plaud 要找的细分群体也在变
回看过去 20 年效率工具的发展,有一条很清晰的主线:工具是为组织服务的。
ERP 管供应链,OA 管审批流程,CRM 管客户关系,各种 SaaS 管项目、管人事、管财务。买单的是企业,使用的是员工,整个设计逻辑围绕的是同一个问题:「如何让组织内的一群人协作得更好、更有化学反应」。
这个逻辑在过去 20 年里非常成功。Salesforce 市值两千多亿美元,Slack 被收购花了将近三百亿,飞书和钉钉各自覆盖了上亿职场人。围绕「组织效率」这个方向,长出了一整个庞大的产业。
但 AI 开始改变这个逻辑。
变化其实已经在发生了。一个投资人,自己用 Deep Research 跑一遍行业数据,出一份初步的研究报告,用 OpenClaw 作为一个远程、能干活的实习生。
一个自媒体创作者,用各种 Skills 组合,做出一整套辅助选题、整理素材、生成初稿框架的工作流。
当一个人借助 AI 能独立完成过去需要一个小团队才能干的活,他需要的工具形态就变了。
他需要的是一个围绕「他自己」转的工作系统。能理解他的工作习惯,能沉淀他个人的知识和经验,能跟着他在不同项目、不同场景之间流转。组织给他配的那套系统,解决的是「这个团队怎么协同」的问题,解决不了「我个人怎么变强」的问题。
在中国市场下,AI 催生了一种越来越普遍的职业形态:超级个体。2025 年 1 月,「十字路口」团队就已经与姜 Dora 聊了聊「当越来越多的人想成为超级个体」这件事,预测了这个趋势。
一个人可以同时接咨询项目、做内容输出、管理自己的投资组合,身份在不同项目之间灵活切换。个体本身就是一个「组织」。他一个人就是 CEO、执行团队和知识库。
这类人群在过去两年急速生长。自由职业者、Solo Founder、知识型创作者,你在任何一个社交平台上都能看到越来越多这样的人。
而他们跟传统职场人有一个很大的不同:比如,对于钉钉、飞书这些名字,很多人的感知是背后连着的是打卡,是排期,是周报,是 OKR 对齐,是一整套「被管理」的联想。对于一个独立工作的个体来说,打开这些工具,扑面而来的是一股「效率增进」感。
但他们要的可能是相反的。他们想按自己的节奏来,慢慢积累能力,慢慢沉淀知识,不被任何系统推着跑。
在这样的场景下,Plaud 它要帮你解决的核心问题就转换成了:当一个人的工作高度依赖对话时,这些对话如何持续转化为个人的知识增长?
换句话说,它要扮演的其实是一种 AI 幕僚 的角色。
这些「三高用户」每天都在进行大量高密度交流:客户需求、专业判断、商业信息、行业观察、临时灵感……很多价值极高的信息都存在于对话之中,但绝大多数情况下,它们只在当下被使用了一次,然后就消失了。
如果没有一个系统去记录、整理、理解这些信息,一个人的经验增长其实是非常低效的。
所以,如果只是一个「组织内」的工具,并不足以做到这种程度的助力。
这时候,Plaud 的角色就不再是一个简单的软件,而更像是:一个始终在旁边的 AI 幕僚。
这套逻辑如果跑通,它绑定的就是你整个人的工作方式。你用得越久,它越了解你的思考习惯和信息偏好,你也越离不开它。这个迁移成本,比换一个 App 高得多。
当然,说 Plaud 只做个人场景,大厂只做会议场景,这么切一刀也太绝对了。
现实情况是,这 2 个方向有交叉。会议本身就是个人工作流的一部分,一个咨询师一天开 3 个会,会上聊的东西最终还是要沉淀到他自己的知识体系里。
区别在于出发点:
大厂从「会议」往外延伸,产品逻辑围绕的是如何让这场会开得更高效、留痕更完整、任务分发更清晰。Plaud 从「个人」往外延伸,会议只是它采集信息的众多场景之一,跟访谈、电话、面聊并列,最终都汇入同一个人的知识库。
而且 Plaud 也在主动补上会议这块拼图。今年 2 月 Plaud 在国内发布桌面端产品,能够直接捕捉腾讯会议、Zoom 这类线上会议的语音信息。
这个功能落地,意味着 Plaud 的采集能力就不再局限于线下面对面的对话了,线上会议的数据也能接进来,跟线下录音汇到同一套系统里做处理。
与此同时,在过去的 2 年内,为了应对各种各样的竞争、用户需求,Plaud 仍然做出了非常多的动作,在产品形态上就出现了多个产品线:
回过头来看,Plaud 的愿景在过去两年也经历了好几轮迭代。
最早是「AI 录音公司」,后来变成「AI 服务公司」,现在,Plaud 创始人许高说:Plaud 将会变成「构建下一代智能基础设施和交互界面」。
这个愿景膨胀的速度有点快,但背后也有它的道理。
当全球有 150 万各领域的专业人士都在用你的产品时,你能做的事确实远比「录音」大得多。录音只是采集的第一步,后面的提炼、整理、分发、再利用,每一步都有巨大的空间可以做。
这场仗的胜负手在哪里
AI 录音硬件赛道有一个越来越明显的共识:硬件本身的门槛在降低,真正拉开差距的是后端的 AI 服务能力。
一个录音卡片的本事可能只是个入口,「离线数据」的入口,它所产生的价值相比于其后续链条来看,是相对较低的。
用户愿意持续付费的,是它背后那套能把录音变成可用知识的 AI 能力。
说白了,AI 整合能力 = 用户体验。
拿 Plaud 举例,Plaud 支持「多模态输入」,用户可以在录音的同时,手动往里面添加照片、文字,也可以点击「标记」或者在硬件设备上 " 打点 ",Plaud 在进行总结时会重点分析这一段时间里的内容,可以说每一步都是为了让人给到 AI 更多上下文:
像我们就用 Plaud 重新回顾了下 Koji 最近的「OpenClaw 20 问」节目,图片、文字、标记的内容都会被整合到里面去:
这样后续才会有更全面、更深入、更匹配个人意图的总结和分析。
Plaud 产品的另一个比较大的特点是内部集成了非常多的「模版」,一共大概有 8000+ 个,每一个模版基本上都对应了一个垂直场景,这种多维总结更好地支撑了 Plaud 面对各种对话场景的理解能力,比如下面这个「推理总结」模版,就能够自动生成结构化的总结内容:
在「推理总结」模版下,除了基础的转录内容、标记之外,还会给出一份详细的图文纪要:
产品内部集成了 Ask Plaud,类似于一个 AI 幕僚的角色,支持在已经转录好的语音内容文档里进行 AI 问答,而且内部还有非常多「技能」,这类似于 Claude 发布的 Skills 的概念,将一些重复性工作做成了一套常用流程。
比如,在 Ask Plaud 对话栏里,可以直接点击「获取洞察」、「背景说明」,来定向获取文档中的相关内容,所有的答案都会以技能内置的结构展示出来:
除了单纯的 AI 产品体验之外,对 Plaud 来说,先发优势体现在 3 个层面:
【1】一是品牌心智 ( 在用户群体中已经率先建立了认知,Plaud = 服务于个人的 AI 幕僚,将对话持续转化为个人的知识增长)
【2】二是数据飞轮( 用户用得越久,AI 越了解他的工作方式,产出越精准,就越离不开 )
【3】三是 AI 能力的持续迭代。
用户量越大,使用场景越丰富,Plaud 对「怎么把对话内容变成有用的东西」这件事的理解就越深。
当然,说到底,这些壁垒都是在建的,还没建完。Plaud 故事远没到可以下定论的阶段。大厂有基础模型能力和更低的获客成本,华强北有更好、更白菜的硬件性价比。
Plaud 该如何在「强敌环伺」的情形下,找到一个稳定的场景往下走?仍然是一个问题。
不过,在中国市场内,Plaud 作为品类的定义者,它的每一个行动,都注定会被业内关注。
AI 记录赛道的热闹,其实只是一个缩影。
更大的故事是:当 AI 让个体的能力边界急速扩张,围绕「个人」而非「组织」设计的工具,正在成为一个全新的品类。
这个品类的终局会是什么样,现在没有人能给出确定答案。
Plaud 给的答案是「个体、超级个体」。让一个人记住更多、想得更深、决策更准,让个体拥有过去只有团队才有的信息处理能力。
大厂与 Plaud 的 2 条路径大概率会长期并存。但有一个趋势越来越明显,当 AI 让一个人可以干一个团队的活,当越来越多的人选择以独立个体的方式工作,围绕「个人」而设计的工具,可能比我们现在想象的更有生命力。
Plaud 在国内与大厂们的「竞赛故事」,很可能会在同一个品类下,走向 2 个完全不同的方向。