IT 之家 11 月 25 日消息 在本月上旬举办的 2020 小米开发者大会上,小米发布发布小爱同学 5.0 版本。
小米集团副总裁、集团技术委员会主席崔宝秋此前表示,小爱同学将从过去的语音助手升级为智能生活助手。
IT 之家了解到,今日上午,小米创办人,董事长兼 CEO 雷军发文表示,小爱同学激活的设备数已经达到达 2.28 亿,月活已经达到 7840 万,累计唤醒 617 亿次," 小爱同学也成为目前行业内唯一一个拥有大规模落地场景的语音助手 "。
以下为《雷军:小爱同学 5.0 背后的人工智能》全文:
在月初举办的 MIDC 开发者大会上,我们发布了最新一代的小爱同学——小爱同学 5.0。全新的小爱同学带来了五大升级,覆盖了囊括影音娱乐、生活服务、信息查询、出行路况等 8 大领域 1400 技能,成为大家生活中离不开的智能生活助手。
从 2017 年 3 月 21 日," 小爱同学 " 第一次与大家见面,到现在仅仅 4 年时间,小爱同学激活的设备数已经达到达 2.28 亿,月活已经达到 7840 万,累计唤醒 617 亿次,小爱同学也成为目前行业内唯一一个拥有大规模落地场景的语音助手。
新一代小爱同学的 5 大升级包括:全场景智能协同、对话式主动智能、定制化情感声音、多模态融合交互和智慧学习好助手。
小爱同学 5.0 全场景智能协同
目前,拥有 5 件及以上连接小米 AIoT 平台的设备用户已达 560 万。随着用户家中的智能设备越来越多,使用和操作也变得更加复杂。全场景智能协同就是让小爱同学 5.0 成为控制家中众多 IoT 设备的大脑,当你发出一条需求指令时,小爱同学会进行统一决策,家中多个设备进行协同配合,达到 " 再多设备,都能化繁为简 " 的效果,是当之无愧的 " 智能生活助手 "。
截止 2020 年 6 月,使用协同唤醒的总用户数已达 94.4 万,同时唤醒的拦截次数已达 9.4 亿。
小爱同学 5.0 对话式主动智能
有别于传统移动互联网 APP 或信息流被动猜测用户的形式,对话式主动智能产品形态是小爱同学以自己的方式和节奏与用户互动沟通,像人一样发起问题来增进对用户的了解。
小爱同学 5.0 通过强大的自然语言处理技术,主动学习其中关于用户的知识,从而建立记忆。这有赖于小米自然语言处理技术(MiNLP)的深厚积累,MiNLP 目前已迭代到 3.0 版本,支持 30 多个业务场景,日调用次数达 80 亿。
在记忆的存储方面,小爱同学云端大脑会为用户建立多维度的个人画像,实现全设备个人信息互联互通。小爱同学的所有功能,会对内共享这些关于用户的 " 记忆 ",每次交互结合个人画像进行计算,产生出面向用户个人的个性化结果。
为了满足用户提出的,可以跨越地理、时间阻碍,随时随地就可以得到陪伴感的 " 情感诉求 ",小爱同学定制声音项目应运而生。
定制化情感声音的实现,不是仅依靠常规声音处理技术就可以做到的。首先需要能够对用户音频数据进行预处理。然后是提取关键声学特征,区别不同音色在频谱上的表现。最后是通过定制合成音库训练的基础模型,进行自适应学习,最终才能可实现只需少量的用户录音,就能取得很好的合成效果。
小爱同学 5.0 将学习作为一个重要的升级模块,整合了海量的优质的 K12 网课资源,精选 1000 网课视频资源,与读书郎、义方教育等 35 家优质资源方达成了合作,并拉通了电视 / 音箱 / 手机教育会员同步。
另外一大工具,就是翻译。为了让翻译更高效、更精准,小爱同学团队在文本前处理模块进行了优化,包括基于语言规则和模型的文本顺滑技术、融合上文内容的实时文本纠错算法、基于多语言预训练模型的实时语义断句算法等。
为了让小爱同学与用户之间进行更自然的沟通,我们做了更智能的多模态融合交互,可以通过声音、肢体语言、信息载体(文字、图片、音频、视频)、环境等多种方式与智能设备进行交流。打破了传统 PC 式的键盘输入和智能手机的点触式交互,定义了下一代智能产品和人的专属交互模式。
小米集团拥有非常丰富的业务线,包含了硬件产品、电商和新零售以及互联网业务。小米的人工智能不仅仅体现在小爱同学上,还拥有非常广泛的应用领域,比如计算机视觉技术、计算机语音技术和机器学习技术等。
同时,我们也在积极引入全球顶尖的研发人才,比如我们成功邀请到了人工智能领域的顶尖专家 Daniel Povey 加入小米。