最近,我们三易生活在工作层面上,遇到了一次小小的 " 挫折 "。具体来说,在一天晚间,我们的一位同事需要参与一场技术沟通活动,在活动开始前我们告知 Ta,需要对活动全程进行录音,以便于能够在第一时间上线相关报道。
但结果是,一方面这位同事在活动开始 20 分钟后才想起来打开手机上的录音 App。另一方面,虽然他的手机已经价格不菲,但最终的录音效果却让我们的后方编辑听得直皱眉,基本只能听清他的声音,至于其他人的回答,则统统都像是 " 盖了棉被 " 一般模糊不清,让人难以据此下笔。最终我们不得不放弃第一时间进行报道的计划,转而等待相关速记资料,为此很是耽误了一些时间。
那么为什么会这样呢?从硬件层面来说,这可能是因为我们这位同事使用的手机内置麦克风硬件性能不足,或是麦克风在长期使用后被灰尘堵塞了。但从软件上来说,这也令我们不禁想象,如果他的手机能自带一个基于 AI 技术对录音进行自动增强,甚至是自动转写、总结、提取关键信息的功能,那么结果就可能会完全不一样。
Plaud 不只是一根 " 录音笔 "
Plaud 是什么?关注科技办公设备、新概念 "AI 产品 " 的朋友,可能听说过这家最近异军突起的 AI 硬件品牌。
在产品属性上,Plaud 的录音设备不只是拥有独特的、卡片式的造型,以及可磁吸固定在手机背部的设计,它还拥有比传统笔式录音设备更多的麦克风数量,基于 AI 的自动降噪、自动模式切换算法。
用好大模型与云计算,是 Plaud 的诀窍
那么,Plaud 是如何实现这样的产品体验呢?根据 Plaud.ai 合伙人、中国区 CEO 莫子皓透露的技术要点来看,Plaud 相比传统的录音笔或手机录音 App,主要是实现了两个方面的突破。
其次,就是 Plaud 不只是可以做 " 录音内容总结 " 这种 " 基础 " 的功能,甚至还可以基于自身的知识库以及大量总结出的模板,针对录音过程中的场景主动地 " 提出问题 "。
当然,在这种看起来既神奇又有趣的 AI 录音、AI 交互体验背后,来自亚马逊云科技提供的安全可靠、高性价比的一系列云计算、云存储解决方案,自然也就成为了关键性的驱动因素。
与此同时,亚马逊云科技拥有全球覆盖的基础设施,基础设施遍及 38 个地理区域的 120 个可用区,则助力 Plaud 为全球客户提供全球一致的高质量服务,且无需操心基础架构的运维管理,为业务拓展提供更好的运营支撑。继美西区域后,通过在欧洲等区域同步部署,Plaud 实现了对不同区域用户的就近服务,将跨区域用户访问延迟降低了 80%,显著提升了实时语音转写与生成服务的响应速度和用户体验。
如何让用户更满意,Plaud 有独门绝技
需要注意的是,关于 Plaud" 使用 " 大模型的方式,我们在与 Plaud 方面的交流过程中还得到了一个非常有意思的说法。
根据他们透露的信息显示,就在前几天,部分用户在某些场景发现,他们暂时失去了分享录音转写内容的功能。但这其实并不是一个 Bug,反而是 Plaud 独特的产品理念所导致的结果。
但在 Plaud 看来,这样的行为实际上相当于侵犯了用户对个人信息(比如较为私密的对话数据)的掌控权,因此他们宁愿临时 " 牺牲 " 掉分享功能,以此换来更高的录音转写 " 可用度 ",让 AI 可以不受那么多约束地帮用户总结只属于他们自己的对话历史。
类似的,Plaud 在日常工作过程中也有大量只属于他们自己的前置处理逻辑,以便更好地 " 发挥出 " 大模型的效果。这也就导致虽然名义上 Plaud 好像没有自己的 " 私有模型 ",但只要用过就会发现,他们的录音和 AI 转录效果就会比其他类似的产品,明显要好得多。