关于ZAKER 融媒体解决方案 合作 加入

AI 芯片是鸡肋 or 真有用:未来还能一键去码?

[ PConline 杂谈 ] 说起近年来手机上出现的新玩意儿,AI 芯片可能是其中最耀眼的明星。无论是安卓阵营还是 iOS 阵营,旗舰级别手机所使用的 SoC 中,AI 算力总能成为着力吆喝的卖点。例如最近华为发布麒麟 990 芯片,其 AI 模块的算力相比前代大幅提升数倍,甚至登顶安卓阵营 AI Benchmark 榜单;而在最新发布的 iPhone 11 当中,所使用的 A13 Bionic 仿生芯片也表现不俗,性能提升 20%,每秒可执行 1 万亿次运算。可以说,AI 芯片目前已经进入到了军备竞赛阶段。

iPhone 11 所使用的 A13 Bionic 芯片,AI 性能是历代之最

然而,和性能提升可以直观感受到的 CPU、GPU 模块不同,SoC 当中的 AI 性能攀升,其实际应用场景一直令很多朋友感到迷茫—— AI 这么强,日常使用的 APP 似乎也没太大变化,游戏该咋玩还是咋玩。但 AI 芯片是否真的鸡肋?这也未必。

软件应用往往滞后于硬件发展。触摸屏并非是什么新鲜事物,但直到 iOS 横空出世才让人找到正确的交互方式;NFC 早在安卓 2.X 时代就已经实装,但直到近年才迎来各种支付应用的广泛支持。

AI 芯片目前的应用范围并不广,大家可以感受到的,可能就是相机中场景的 AI 识别、人脸认证等等。随着 AI 芯片算力的提升、软件应用的完善,未来的 APP 到底能进化到怎样的神奇地步?今天一起来聊聊吧。

· 为何手机需要 AI 芯片?

作为近年最热门的话题之一,AI 这一字眼频频出现在各类科技资讯当中。而谷歌开发的围棋 AI Alpha Go 一举击败李世石、柯洁,更是令 AI 走进了聚光灯下。和传统的算法相比,AI 能够让计算机的某些举止更接近人类,例如能够识别图像内容、识别句法语义等等,而这些,往往得益于使用神经算法来进行机器学习。

移动互联网时代的到来令数据规模前所未有的庞大,这为 AI 提供了茁壮成长的土壤。这些数据成为了 AI 极其有价值的样本,人们通过神经算法对这些样本进行卷积分类,进行一遍又一遍的机器学习,输出了不同权重的结果,并以此作为识别行为事物的判断依据。从这方面来看,AI 的本质是数据密集、算法先进、分类权重细致的统计学,通过不断输入数据、不断卷积衡量权重,AI 最终所能做出的判断会无比接近甚至超越人类。

AI 芯片能支持多种机器学习模型

由此可见,AI 是依赖特定的神经算法实现的,这个任务交给普通的 CPU 来做,效率比较低下—— CPU 属于通用计算单元,暴力运行某种算法并非其特长,例如 CPU 挖矿的效率就远比不上专门为 HASH 算法特制的 ASIC 矿机芯片。而 AI 芯片正是为密集处理数据的神经网络算法特制的,例如华为的麒麟 990 就可以支持包括 VGG、VDSR 等在内的 90% 视觉神经网络计算模型。

换言之,AI 芯片能否发挥其功用,关键在于软件应用是否对相应的神经网络算法有着良好的支持和运用。随着 APP 不断进化,AI 会越来越多地应用到实际当中,出于算力和能效方面的考虑,AI 芯片(模块)的确必不可少。而当 AI 芯片的性能日益强大时,下面这些神奇的应用可能会渐渐成为我们的日常。

· AI 实时 P 视频

在一些手机中,拍照 APP 可以通过 AI 来识别场景,然后成像风格根据不同的场景变化,例如拍植物增加色彩的鲜艳度让花朵绿叶更加娇艳欲滴,拍人像则增加柔光令皮肤更加白嫩等等。而在未来,AI 在图像识别方面的应用会更加广泛,这在现在已经可以看到一些苗头。

AI 既然可以辨认出场景,自然也能辨认出图像中的事物。例如一张照片中,哪里是人脸,哪里是宠物,哪里是背景,AI 都可以做到比较准确的判断。在这个前提下,AI 实时 "PS" 视频,也就成为了可能。

Google 利用 " 卷积神经网络(CNN)" 技术将人从视频背景中抠出来

例如 Google 之前就展示了一项名为 " 卷积神经网络(CNN)" 技术,它是一种机器学习算法。该技术使用了数以万计的图像数据用以机器学习,并且专门分辨出 " 头发 "、" 颈部 "、" 皮肤 " 等处的数据,能够轻而易举地将人从背景中 " 抠 " 出来,背景自然也可以实时更换。从演示来看,Google 的这项技术的确效果拔群,很轻松就能够在杂乱的背景中辨认人像,然后只置换视频中的背景,效果还非常自然。

Google 利用 AI 实时视频抠图的演示

而相关的应用在国内也由开展,而且可能很快就会和消费者见面。华为在演示麒麟 990 的 AI 性能之时,也呈现了令人吃惊的实时抠图功能。在 AI 的作用下,视频中的人物能够随时变更背景,非常神奇。

华为对 AI 技术的新应用——实时 P 视频

而 AI 算法显然不仅仅能作用于背景,也可以作用于人像。前不久 AI 换脸 APP"ZAO" 的上线,引起了人们的热烈讨论。在 ZAO 应用当中,只要上传一段视频,即可通过 AI 算法将其中的人脸换成另一个人的,这种伪造身份的玩法的确令人感到惊愕。而在未来的 AI 应用中,随着算力的加强,这一过程可能在手机中就能够实时完成,P 一段子虚乌有的视频,并非天方夜谭。

· AI 去码(图像修复)

看到这个小标题,可能很多老司机就顿时不困了。如果说 AI 实时 P 视频只是将已有的元素重新组合,例如场景换成另一个场景、人脸换成另一张人脸等;而 AI 去码,则可谓是凭空画饼,将原本不存在的事物添加上去,这在很多场景下都有极大用途。

一般而言,去马赛克是需要人类 " 脑补 " 的工作。从原理来看,马赛克属于不可逆运算,把大量的小像素点合并到一个大的像素点,并取平均色,就制造成了马赛克——很显然,你是难以知道被搅匀之前的各个小像素的颜色是如何排布的。一般来说,要消除马赛克,需要人进行想象脑补,然后把缺失的内容重新画出来。而有了 AI,人不再是必须了,Google Brain 的算法能够自动去除马赛克,骑兵自动变步兵。

就算是不可名状的马赛克,AI 技术也能修复成高清

Google Brain 使用的是一种全新的像素递归超分辨率技术,通过大量高、低分辨率的采样学习,然后得出规律来匹配修复结果。例如,Google Brain 学习到了某种黑点是属于眼镜,那么在还原马赛克的时候,就可以把这种黑点还原成眼睛。从测试来看,效果的确不同凡响。

这样的 AI 技术有什么用?去除马赛克只是特定场合的具体应用,类似的算法在很多时候都可以发挥作用——只要当图像需要修复的时候,就用用武之地。例如拍照片手抖了失焦了,糊成一片该咋办?传统的方法可能就是简单粗暴的锐化了,而如果拍照 APP 使用 AI 技术,就可以 " 脑补 " 回丢失的细节和锐度,给你一张尽量可用的照片。

· AI 上色

既然 AI 能够识别图像内容、脑补细节,那么 AI 自动上色也就成为了可能。上色其实涉及到了创作层面,而创作被很多人视为人类和机器的鸿沟,但这在 AI 时代不那么灵了。借助 AI 技术,手机 APP 可以自动为黑白照片甚至线稿画作来涂上适合的颜色。

类似的技术现在已经出现。照片处理自不必说,AI 识别场景调节颜色和黑白照片上色并没有本质上的区别;而给线稿上色,在之前曾被认为是不可思议的事情——电脑能够读懂线条勾勒的是何种轮廓、该轮廓还得填上适合的颜色,听上去就如同魔法。不过 Paintschainer 推出的 AI 上色技术却令人大吃一惊——它可以识别某部分属于皮肤,某部分是头发,某部分是衣服,某部分是背景,然后分别涂上适当的颜色。

Paintschainer 的 AI 自动上色,可以精准辨认线稿

不仅如此,Paintschainer 的上色范围还相当精准,尽管线稿没有封闭,但颜色依然会保留在适当的范围,而不会涂得满地都是——用过 PS 中油漆桶工具上色的朋友,应该知道这是什么意思。

这意味着,以后在手机中绘画成为了可能。尽管手机的屏幕小且触控并不算精确(相比数位板),但得益于 AI 已经能辨识线稿,因此手指绘画粗糙的笔迹,就可以被 AI 完补为精细的描线,并填上适合的颜色。对于创作者而言,这大大节省了打磨具体画技所需要的功夫,将更多精力留给设计、构思,提高了效率。

这种 AI 辅佐创作的技术,并不仅能用于摄影、绘画,在作曲等领域也同样适用。或许在不久后,对着手机哼一段旋律,AI 自动帮你编好曲、选择好演奏乐器、最后完成一段高质量曲子的日子,也已经并不遥远。

· AI 自动翻译

语义识别可谓是 AI 另一大广泛实装的应用了。无论是语音识别,还是自动翻译,都离不开精准的语义判断。得益于 AI,近年的机翻竟然也能说人话了——例如 Google 翻译,已经基本做到了语句通顺流畅,用来阅读一些专业性不强的外文,Google 翻译绰绰有余。这是如何做到的呢?

这主要得益于 Google 翻译引入了神经网络和深度学习等人工智能算法,迈入了 " 神经机器翻译(GNMT)" 的时代。得益于人工智能和谷歌的大数据,谷歌翻译对语言的解析有了远比之前深入的理解,因此在长句、整篇翻译方面有了长足的进步。

引入了 GNMT 后,Google 翻译的精度与日俱增,越来越像是说人话了

在未来,AI 翻译还会愈加强悍,也不仅仅局限于静态的文字。例如在 Android 10 当中,引入了 Live Caption(实时字幕)功能,借助机器学习,它能够让手机在播放任何视频的时候,精准识别出音频,并生成字幕。该技术显然可以和 AI 翻译结合,帮助人们啃下各地语言的生肉,大大减少交流的鸿沟。

得益于 AI,安卓可以为任何视频生成字幕,未来有望还能实时翻译

另外,AI 自动翻译还可以用于语音交流。随着处理速度和精准度的上升,手机安装响应的 APP 后,化身同声传译器也并非不可能,虽然对于一些专业词句、地域文化梗的翻译,可能还比不上人工,但对比现在已有的机翻,这无疑要好上太多。

· AI 自动对话

自从苹果推出了 Siri,语音助手成为了人们关注的焦点之一。然而在大多数情况下,语音助手们的表现并不尽如人意,无法理解自然语义、对话机械、无法针对上下文内容应答等缺点,令语音助手如同 " 人工弱智 "。而在 AI 的加持下,未来的语音助手们将会飞跃上新的台阶。

例如,Google Assistant 就已经走在了进化的路上。在 I/O 开发者大会上,Google 演示了 AI 技术加持的 Google Assistant,它能够和人类对答如流,能够识别上下文内容,话语也都非常符合逻辑,无论是内容还是语调都异常接近真人。无论是识别、应答还是任务的完成度,新的 Google Assistant 都远比之前的语音助手表现出色。

得益于大数据和 AI 算法,Google Assistant 的智能程度大大提升,甚至可以对答如流

这样的进化,很大程度上得益于企业利用用户数据训练语音、语言模型——苹果、谷歌、微软、Facebook 等大佬都被爆出干过这样的事情。在未来,手机 APP 的语音交互或许会更加智能,但这种进化的代价却以用户隐私作为代价。我们到底该如何平衡技术发展的需求和隐私信息的保护?这恐怕是值得一直深究的问题。

· AI 信息分类

智能分类在当前很多相册服务中都已经初现雏形。例如在 Google Photo 中,照片可以根据题材、人物等自动归类为风景照、建筑照、美食照、某个人的合照等等,查找起来非常方便。而智能分类的出现,很大程度上依赖于 AI 技术的发展—— AI 通过机器学习,得以辨认出照片场景、主体后,才让智能分类成为可能。

目前 AI 对照片已经能够进行比较精确的智能分类

而伴随着 AI 的进步,智能分类拥有了更多可能。目前智能分类主要涉及照片,而在未来随着 AI 芯片算力的加强,视频的智能分类也将最终得以实现。而由于 AI 经过足够训练后,能够较好地理解语言语义,因此将文稿按照其中内容进行分门别类,也成为了可能。类似的功用也可以作用于音频中,某些音乐 APP 可以将音乐按照不同风格的旋律分类,例如舒缓、激烈、甜美等,而随着 AI 芯片愈发强大,手机本地也可以完成这样的任务。

也就是说,当 AI 发展到一定地步,手机中的相册 APP 能够按照内容整理照片、视频库可以自动分类不同内容的视频、文件管理器可以将近似内容的文档归类在一起、音乐 APP 能够识别风格各异的旋律,都有可能成为现实。而当 AI 将这些结合在一起,视频的自动剪辑、踩点等应用,也将愈发成熟——目前微软 Windows 10 中的相册就已经初步提供了类似功能,但还不太智能,将来手机在 AI 芯片的加持下,利用相应的 APP 一键生成短视频、Vlog 等,将不再是梦。

AI 行为调度

得益于大数据,AI 能够采集方方面面的信息,并给出一个统计学上的最优解。例如 Google 的 Alpha Go,就在学习了大量对弈样本后,得知了围棋每一步的权重,从而击败最顶级的棋手。因此当 AI 的涉及面足够广,它就能以普通人所难以企及的全面视野,来为你安排生活中的点点滴滴,让你真正感受到 " 智能 " 的精髓。

AI 将能成为真正的智能管家

例如,很多人家中都购置了智能家电,但这些家电的调度仍不那么的 " 智能 " ——你需要为它们预设开启、工作的时间段或者条件,虽然比传统家电方便,但仍做不到根据你的实际行程,全自动为你安排家电的开启。

例如当你设置了下班后自动提前开启空调等待回家,但某天突然塞车,又不便操作手机,智能家电并不能因为这个调整自己的开启时间,白白耗费电能。当你需要突然出差的时候,你还得手动调节智能家电的使用方案,更加不便。而如果管控智能家电的 APP 加入了 AI 相关技术,一切可能就变得不同了—— APP 会根据你的行程、身体情况、环境气候等等,自动安排自己的工作时段、时长、模式,你甚至会感觉到电器上的开关功能按钮是多余的——这才叫做智能家电嘛。

总结

AI 的一大魅力在于找出大数据中的内在规律,从而让功能的自动化实现成为可能,甚至能极大程度模糊人与机器间的界限。AI 芯片目前仍处于起步阶段,或许我们现在只能在少量应用场景中感受到它的存在,但随着应用生态的完善,AI 芯片将会为手机带来更多神奇功用,期待 AI 芯片能在未来进一步发光发热吧。

以上内容由"太平洋电脑网"上传发布 查看原文
相关标签 微软aiai芯片

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容