关于ZAKER 融媒体解决方案 合作 加入

从跟随者到开拓者,阿里云数据库角色变化背后的机遇与挑战

【IT168 评论】数据库经过 40 多年的发展与变迁已经改写了格局,在开源、云端浪潮之下曾经的数据库霸主 Oracle 也已经跌下王座,不断向着云与智能化发展,新的厂商也获得了各自机会,在云数据库时代是一个百花齐放、百家争鸣的状态。

由于业务飞速发展,亚马逊和阿里两位电商巨头在 10 年前开始了自己的去 "O"(Oracle 数据库)运动,一直以来阿里云在数据库方面被认为是 AWS 跟随者,如今已经基本做到与 AWS 持平,甚至在某些方面已经领先。

根据 Gartner 统计,阿里云已经位居全球云数据库市场份额前三,年增速在 115%。同期 AWS 增速为 74%,Oracle 为 66%。而 POLARDB 在 2018 年正式商业化后,目前已经是阿里云上增长最快的数据库产品。

去 "O" 运动中的数据库市场变迁

2013 年阿里巴巴最后一个 Oracle 数据库从从其淘宝核心系统中下线,10 月 15 日亚马逊宣布其消费者业务也关闭最后一个 Oracle 数据库。

上个世纪 70 年代以关系型数据库起家的 Oracle 一直以来都是商用数据库的王者,与 IBM DB2 以及微软的 SQL Sever 基本垄断了传统商业库市场,曾经阿里是 Oracle 数据库在中国市场的头部客户,但是随着业务的发展,Oracle 在性能上已经无法满足,而且成本高昂。

2009 年前后阿里巴巴的总体流量一直高速上涨,但王坚博士认为如果再以当时的架构持续下去,为了能够支持流量的承载,阿里巴巴购买服务器、数据库产品的支出就足够让阿里巴巴破产,所以阿里巴巴开始了整个 IT 架构的升级,在对上层进行了微服务化后开始去 "IOE" 之路,其中的 "O" 就是 Oracle 数据库。

数据库是最难迁移的技术之一,因为通常企业中的多个软件应用在数据库上运行,一旦更换新的数据库所有应用程序都要被重写或替换,往往数据库项目迁移需要数年时间,亚马逊和阿里数据库迁移便是很好的例证。

2008 年之后阿里基于开源数据库 MySQL 做 AliSQL 对内核进行改造调优,2011 年随着阿里云的发展,开始进一步基于 AliSQL 搭建 RDS 平台,既对内服务又对外输出。在 2013 年淘宝下线最后一个数据库,之后阿里云数据库更多的是对外商用,不仅将阿里云数据库的技术,还有实践经验对外输出,与此同时阿里云数据库也逐步构建起 MySQL、AliSQL、PostgreSQL、MariaDB 开放数据库生态,2017 年阿里云数据库用户实例突破了 10 万大关。

阿里和亚马逊的去 "O" 之路是数据库市场变迁的一个缩影,从以 Oracle、DB2、SQL Sever 为主的传统商业数据库,到以 MySQL、PostgreSQL、MongoDB、MariaDB、Hbase 为代表的开源数据库,据悉阿里巴巴在 2013 年左右开始大规模使用开源数据库,这与 DB-Engines 的数据库流行度趋势非常吻合,从 DB-Engines 数据库流行度来看,开源数据库从 2013 年开始到现在一直增长,直追商业数据库。

而在云端浪潮之下,数据量的激增,使得传统数据库和开源数据库在性能和成本等方面已经无法满足,云原生数据库正在引领数据库市场的新潮流。

阿里云数据库事业部总经理曹伟在今年云栖大会上指出云原生数据库未来发展趋势:

弹性:弹性不仅仅是规格的弹性,而是未来 CPU、容量等计算资源都可以按量付费。

HTAP:之前 TP 和 AP 是分开处理的,TP 使用关系型数据库,而 AP 使用大数据存储。未来则会融合两者,提供一个入口跑事务,一个入口跑报表和 BI。

智能:智能让数据库更加实用,未来数据库的磁盘备份、内存调度等都不需要 DBA 来操作,而是全部由数据库自己来完成。此外,数据库还能够自动完成诊断和修复。

混合云:因为一些合规的要求,并不是所有数据都能跑在云上,因此还需要使用云上云下互联的生态。

云原生数据库的发展来自于云计算厂商的数据库自研之路,AWS 和阿里云是其中的代表," 我们背靠阿里巴巴集团,身处复杂的生态环境,从电商到线下的新零售,像盒马以及线上娱乐如优酷等等,不仅对我们的技术提出了非常大的挑战,也提供了极为丰富的练兵场。这是我们能够持续走下去并不断衍生出新技术的一个核心保障。" 阿里云智能数据库事业部负责人李飞飞在接受 ITPUB 采访时指出。

而在云原生时代阿里云也完成了从跟随者到开作者的转变。

从跟随者到开拓者

从传统商业数据库到开源数据库,再到自研数据库。自研之路往往艰难,而这条艰难之路更代表未来。

2014 年 AWS 发布了关系型数据库 Aurora,2015 年阿里开始自研新一代云原生数据库 POLARDB,选择了和 Aurora 同样的思路,采用存储计算分离、软硬一体化设计。

2017 年阿里云公测自研关系型数据库 POLARDB,被阿里称为新一代数据库的 POLARDB 当时在业在内并没有引起太大的轰动,它被认为是 AWS Aurora 的跟随者。在云端,不仅是数据库模块,从 IaaS 到 PaaS,AWS 都是是绝对的领先者,但是中国的数据库产品跻身世界一流数据库品牌正是从阿里云推出 POLARDB 开始的。

李飞飞在接受 ITPUB 采访时曾坦言阿里云跟随者的身份:" 我觉得我们一开始是一个 Follower(跟随者),这个没什么不好意思承认的。但是我们要从 Follower 做到超越者,做到 leader。"

经过十多年的发展阿里云已拥有非常丰富的云数据库产品家族,涵盖关系型数据库、非关系型数据库、分析型数据库以及迁移工具等,满足用户不同的数据库应用开发需求,并且解决企业核心业务上云的关键难题。

李飞飞认为阿里云已经从 Follower 做到基本与 AWS 持平,甚至在技术上某些领域做到了领先。比如 OLAP , AnalyticDB 的性能已经在 TPC-DS 上打榜,并排到了第一。通过和 AWS 官方 Redshift 对比(在 AWS 上去买 Redshift 跑同样的 Workload),在 TPC-DS 的很多 Query,AnalyticDB 的性能都要优于 Redshift。另外,在某些领域,阿里云已经做到了人无我有,比如,在分布式数据库板块,因为阿里集团的 " 双 11" 场景需求,需要做 share-nothing 的架构。因此在 PolarDB 基础上做了 PolarDB 分布式版本。以 Share-nothing 的分布式架构来支持 " 双 11" 海量高并发数据的应用场景支撑,AWS 并没有和阿里云对标的产品。

很多业内人士指出实际上阿里云数据库的整体能力并不仅仅表现在相对完善产品堆栈,这一点 AWS 也比较完善,更多的是对中国市场和客户需求的理解以及这些年来积累的实践经验。李飞飞曾经谈到过中美客户的差异,比如很多大中型国有企业,美国没有这种组织架构,其需求和美国的商业公司肯定有不同。" 这会对我们的技术演进之路提出一些新的思考、新的挑战,也就会使我们最终会走出一条不同于 Aurora 的技术之路。"

但是在云端浪潮下,更为激烈的变革序幕已经开启," 传统数据库会像马车一样被淘汰。" 李飞飞表示。Gartner 的调研报告指出云数据库正在快速增长,到 2022 年预计有 3/4 的数据库天然部署或者迁移到云上。

而在中国市场也到了传统产业变革的下半场,只是这个更为庞大的市场上云并没有那么快,尤其在核心的数据库方面,有的行业甚至无法上云,一位在数据库领域从业超过 20 年的老兵质疑过 " 云计算厂商开发的数据库系统,市场目标是在自家的云上提供服务,而不是作为传统软件卖许可证。因此,很多打算摆脱 Oracle,采用国产数据库,但又还没打算上云的用户,就很难享受到这类产品。"

在云端曾经的数据库王者 Oracle 也不再拥有优势,这也给阿里云等挑战者一个超越的机会。

面对这样的困局,这一次阿里云走在了前面。在 2019 年云栖大会上阿里云首推云原生数据库一体机 POLARDB BOX,它能够更好地帮助用户在私有云上使用 POLARDB 数据库,实现 " 把云带回家。" 在云端转型更加深入的当下阿里云进行了有益的探索," 把云带回家 " 也让 POLARDB 从跟随者变成开拓者。

目前阿里云数据库已服务政务、零售、金融、电信、制造、物流等领域的龙头企业,已有约 40 万个数据库实例迁移到阿里云上。

阿里巴巴的价值观中有这样一条:" 唯一不变的是变化 ",在这个飞速变革的时代,技术的演进与更迭速度正在成倍增长,十多年的数据库实践让阿里云积累了技术经验和相关方法论,不过传统产业的需求更加复杂多样,其中也不乏华为、AWS 等同台竞技的玩家,战争的号角也只是刚刚吹响,还需要阿里们深入到产业中去探索与磨合。

10 月 25 日,阿里云数据库技术沙龙北京站即将举行,本次沙龙特别邀请阿里云数据库专家团队分享阿里云数据库在阿里巴巴集团业务的广泛应用以及阿里云数据库背后的黑科技,资深阿里云数据库专家也将对现场收集的问题和痛点进行解答。欢迎扫码报名观看直播。

以上内容由"IT168企业级"上传发布 查看原文
IT168企业级

IT168企业级

IT168企业级官方互动平台

订阅

觉得文章不错,微信扫描分享好友

扫码分享