关于ZAKER 融媒体解决方案 合作 加入

美团推出盲人定制语音点外卖应用,不只为「献爱心」

极客公园 10-21

10 月 15 日,第 36 届国际盲人节,美团 app 中上线了一项面向盲人群体的语音交互新功能:美团语音盲人定制应用——点击美团 app 搜索入口的麦克风,说出无障碍外卖,用户就可以通过语音交互完成从选餐厅、菜品,买单甚至是售后等一系列动作。

为了推出这款新功能,美团在 10 月 14 日北京 798 园区召开一场媒体沟通会。

发布会上,中国盲协主席李庆忠感慨,中国有 1700 万盲人,却鲜少有人能充分享受到互联网产品带来的福利。通过和美团的合作,给盲人的生活方式带来了很大的改变,「这对于盲人群体来说,已经是一个巨大的改变」。

愿意为弱势群体专门制定产品的公司不算多。微软此前曾经专门为盲人群体制定出可以玩的 Xbox 游戏机,苹果专门为盲人开发的 iOS 系统……而在本地生活服务领域,美团属于为盲人定制语音应用的第一家。

(美团语音平台负责人蔡勋梁 图 | 美团)

据美团语音平台的负责人蔡勋梁透露,早在 2017 年美团语音平台成立起,就有工程师提出想为盲人群体开发特定版本。今年 6 月,美团和中国盲协正式达成合作后,语音交互的盲人定制应用开发很快被提上团队日程。

「语音点外卖」听上去很简单,但涉及到的多轮语音对话技术和复杂场景语义识别却是业界公认的难题。美团首席科学家张锦懋笑称,如果用户问 Siri:你多大了?它可以抖一个机灵:对不起,这是一个秘密。但在直接涉及到用户吃喝住行日常生活的美团上,用户问最好吃的餐厅是什么,平台抖机灵或者不知道就不可能被用户接受。

美团语音平台有自己的底气。在给盲人提供这项新功能前,团队已经在公司内覆盖 30 多个需要语音对话的技术场景,涵盖了美团各条业务线,包括骑手语音播报,客服处理,酒店、到店业务等。每天,语音团队需要处理 50 万小时的语音包括识别和合成等各种需求。

同时,为盲人提供这样的应用对于美团而言,也是一个不断优化自己技术能力的实际场景。

按照美团联合创始人、高级副总裁王慧文的说法,当一个新的科技出现的时候,或许它暂时还不是那么成熟,体验没有那么好。但是如果有些用户的需求能被这个科技满足,在这种情况下,服务好这些用户需求最佳实现价值和落地的场景。随着技术的越来越成熟,它能够服务的人群也会越来越大,这也符合美团「帮大家吃得更好,生活更好」的使命初衷。

从「解决一部分人的问题」到「为了每个人更好的体验」,是美团作为科技公司在解决问题的新思路,它提供的社会价值绝不止于「献爱心」。长远来看,这种新思路应该成为所有科技公司产品思维的组成部分。

六倍速的声音,「刚刚好」

盲人有外卖需求吗?答案是肯定的。

美团的一份面向盲人群体的调研报告显示,有 87% 的视力障碍者使用过外卖服务,其中 70% 的受访者表示,用手机点外卖是他们最常用的点外卖方式。甚至有接近 40% 的受访者指出,外卖现在已经是他们重要的解决三餐的方式之一。

怎么使用手机点外卖却不是一件简单的事情。对于盲人群体来说,过去使用智能手机的方式主要是读屏软件。这对听新闻或者获取资讯难度并不大,但在点外卖等复杂场景上并不友好,生活服务获取的过程不是简单的一问一答,其中涉及到多重选择与交互,还涉及到最终支付的环节,通过触摸屏幕来完成全链条交互对盲人来说非常困难。

比如,弹窗红包本意是给用户的福利,但在盲人使用时要关掉一个小小浮层弹窗就已经是一件难事了。即使能听到有关闭的播报,但怎么在大屏幕上找到一个小叉并不容易。同理,在点菜过程中有很多关键操作是通过按钮来完成的选数量,选规格等,而这些按钮通常非常小,盲人使用起来非常费劲。

(对于盲人群体来说,红包弹窗是一个影响操作的设置)

而「语音 + 生活服务」是更好的帮助盲人「解放双眼」的方式。为了解决这些问题,美团语音平台在盲人定制语音应用中重新对产品进行了设计。从 8 月初项目立项开始,蔡勋梁带着他的团队和中国盲协进行了多次沟通,同时在一线与盲人群体进行多次调研,力求了解盲人真正的需求是什么。

在当天的大会视频中,现在用户启动无障碍点外卖功能后,盲人用户不管是说菜名、商家名,还是口味,抑或是点餐历史,平台都可以准确的识别其中含义,并给用户近乎完美的反应。并且,美团 App 会根据过往的使用历史智能匹配用户的地址,而不需要用户自己反复输入编辑。

在顺畅的操作流程背后,蔡勋梁的团队做了许多调整。其中,简化语音对话操作的流程是根据盲人群体的需求做的最大改变。

在这个特质应用中,美团语音团队把整个应用核心功能区的信息卡片做成单个大卡片,通过快捷按钮的方式快速往下翻或者返回,这让信息展现变得更加充分。用户按住 app 底下的点外卖功能,就可以根据语音指示选择选择餐厅菜品,完成挑选、增减、买单等一系列动作。

在简化操作之余,他们也听到盲人一些「意料之外」的需求。比如,许多盲人告诉蔡勋梁,他们希望语速更快一点,因为盲人的听力水平普遍要更好。

对此,蔡勋梁也对这些系统做了调整,做了五档可调的语速设置,最快的是常规语速的 6 倍速度。蔡勋梁说,他们调研的一些盲人对「六倍速」格外满意,「刚刚好」。

除此之外,蔡勋梁在调研过程中,还发现盲人用户对科技互联网产品的需求远超他想象。比如,有盲人向他们提出能不能用智能音箱点餐,能不能通过语音打车。还有盲人提出,外卖吃来吃去只有那几家,「能不能来一个性化推荐」。

对于这些需求,在 14 号的发布会上,张锦懋代表美团做出了回应。未来通过语音在美团 app 上,用户还可以完成到找餐厅到打车去餐厅等跨领域的交互动作。在部分汽车和音箱上,也已经可以通过语音交互的方式获取生活服务,而个性化推荐将是今后重要推进的功能点之一。

小麦克风背后的「大」挑战

在输入的方式和播报的速度之外,小小的麦克风背后面临的挑战并不小。在现有技术下,机器将语音转成文字不难,但如何准确理解这些文字背后的需求却是一个十分复杂的问题。

(进入美团 App , 点击语音说出无障碍点外卖就可体验语音点外卖)

比如,当一个用户说出自己的地址在朝阳时,机器能不能理解这个朝阳是北京的城区还是和辽宁的市;如果用户说想去最近的一家海底捞,系统怎样匹配离用户最近的餐厅;甚至当用户说,我想吃点辣的,系统如何和餐厅进行匹配都是问题。

这个摆在美团语音平台团队背后最真实的难题,被张锦懋和蔡勋梁归结至技术层面。其中最关键的技术难题为多轮对话技术,语音识别和理解,对话技术,知识图谱和大数据技术的支撑。形象点来看,这个技术中要解决是如何让系统理解不同人口中的「朝阳」、「最近」、「辣」的含义。

从定制应用的体验来看,尽管要调动大量语义识别、LBS 匹配功能,在服务水平上这个语音平台已经称得上成熟。

但走到这一步,美团语音平台花了两年时间。

2017 年,作为语音平台的核心组建成员,蔡勋梁在和公司管理层讨论成立语音平台时,就确立美团语音平台的定位:「让每一个人获得生活服务就像说话一样简单」——用户只需要说出需求,美团就可以准确理解并匹配这些需求。

作为中国领先的本土生活服务平台之一,美团有需求,也有自信。

对于美团来说,用户数据安全是自研语音平台首要考虑的需求。「如果跟第三方来合作这件事情的话,会面临非常多的这种数据的壁垒,比如说隐私的壁垒这样一些问题。」

作为语音领域从业时间超过十年的技术人员,蔡勋梁认为不管是数据积累还是技术积累,美团都是最能够理解清楚用户需求,并且从系统动作角度来讲,给出最合适响应的公司。

不过,尽管内心认可语音平台的意义,但蔡勋梁曾也一度心里打鼓。

美团向来鼓励创新,但同时很多新业务「开得快,关得快」。与同类人工智能技术相比,语音比文字、图片的处理训练耗费的成本要更高,市面上的人才也更少。这意味着一旦开始做,这将是一个漫长而庞大的投入,「这个东西它没有捷径可走」。

他的纠结并没有持续很久,管理层的肯定给了蔡勋梁开展业务的支持。蔡勋梁回忆,当他去和包括王兴、王慧文在内的高管汇报工作进度时,他们给出的态度一致:「这些事情就是我们要去做的,我们也一定要让它解决的真正问题。」

但怎么结合公司的业务做产品并不是一个简单的问题。以语音技术最核心的多轮对话技术为例,其技术链条非常长——从 AI 语音识别到利用「知识图谱」等技术做理解,再到系统里面查找对应的位置、产品资源,最后才能输出给用户反馈。任何一步出问题,都会影响最后的输出。

(图 | 美团)

为了解决这个问题,蔡勋梁带着团队在酒店、外卖打包等场景做过多次尝试。甚至每天到点外卖时间,美团语音平台团队都会用手机「调教」产品。在蔡勋梁看来,每一项技术指标的优化,都必须经过反复的打磨,「它没有捷径可走。」

两年时间,不声不响中,在内部美团语音平台已经开始在 30 多项业务中发挥作用,逐渐取代过去的第三方应用。

比如,美团客服所使用的语音系统现在就由美团自己的语音团队进行开发。过去的语音系统,可以做到自动给商家去拨打电话,对打不通的电话却没用。在使用蔡勋梁团队开发的产品后,可以进一步对打不通的电话做分析,对空号等电话、不在服务区的状态筛出来,便于客服做进一步动作。

「For everyone」

美团语音平台在组织层面分归美团联合创始人王慧文分管。在当天的发布会上,王慧文不吝对推出盲人定制应用的肯定和赞赏。

在他看来,一家企业的价值一部分来自于商业价值,另一部分则来自于社会价值,「无论你做什么产品,归根到底要看这个产品有没有产生社会价值,是否让消费者有幸福感。」

为盲人群体服务同样符合美团的使命。在他看来,给 14 亿人服务的产品,也一定要从服务好一小部分开始。在那句「eat better,live better」使命背后,其实还藏着「for everyone」。

另一方面,从业务方向来看,在公益上的投入并非无益。从集团内部应用迈向公益,不仅对盲人群体意义重大,对美团语音平台同样是重要一步。产品经理出身的王慧文认为,一个产品得让用户用起来之后,才理解产品的问题并予以改进。因此找到一个很好的落地场景变得至关重要。

在做语音平台这件事上,王慧文并不急求它立即带来商业回报。技术的发展应当尊重客观规律,需要长期有耐心的投入。

事实上,大部分人只看到了美团在产品上的「试一试」,却忽视了美团在指向未来的底层技术上的投入和积累。

和语音平台相似的还有美团的无人车研发团队。2016 年,现美团无人配送部总经理(当时是外卖配送总架构师)夏华夏注意到自动驾驶技术的发展,经过观察他得出结论,这项技术可以帮外卖业务大忙。

(美团无人配送车 | 美团)

和语音平台一样,在外界看来,自动驾驶技术的落地还需要许多年,并不一定需要美团自己做。但夏华夏在和管理层沟通想法后,很快得到了集团的支持。到 2018 年美团的无人配送团队已经成为一个 100 多人的团队,并独立为一个部门,在组织架构上甚至和外卖事业部平行。

在技术迭代方面,美团有自己清晰的方法论。「长期有耐心」是这家公司的重要文化,在布局长远技术的方面更是如此。利用长期的合适的资源聚焦于更有效的场景,是王慧文眼中一种更合适底层技术的方式。当一项新技术科技刚出现,由于技术成熟度和体验性能的问题,很多用户会因为它还不够好忽视它的价值——「部分人高估了一年年的变化,而低估了五年十年的变化」。

王慧文相信,随着技术的成熟,未来老人甚至是不会用手机的小孩同样可以用语音实现各种服务,「最后你也用,我也用」。

责任编辑:卧虫

图片来源:美团

以上内容由"极客公园"上传发布 查看原文
极客公园

极客公园

这里汇聚着优秀的产品观察报道、高质量的线下活动

订阅

觉得文章不错,微信扫描分享好友

扫码分享