关于ZAKER 免费视频剪辑 合作 加入
钛媒体 09-24

让超算再升级的存储系统,华为凭什么?

世界上第一台计算机叫什么?很多人可以不假思索地回答—— " 埃尼阿克 " ( ENIAC ) 。

那么," 埃尼阿克 " 最初被用来干什么呢?少有人知道,1946 年," 埃尼阿克 " 是为了解决弹道计算问题而生,宾夕法尼亚大学花费 40 万美元巨资才研制出 " 埃尼阿克 " ,当时的计算机是一种战略物资。

在很长一段时间后,个人 PC 的普及才让计算机逐渐进入大众视野,IBM 和 Apple 都是第一代家用电脑厂商,而计算机作为战略物资的属性以另一种名字保留了下来,也就是 HPC ( High Performance Computing,高性能计算 ) 。

HPC 成为计算机科学的一个分支,使用超级计算机和并行处理技术解决复杂计算问题,主要瞄准大规模科学问题的计算和海量数据的处理,如科学研究、气象预报、计算模拟、CFD/CAE、生物制药、基因测序、图像处理等等。每年的全球 HPC Top 500 高性能计算机排行榜都备受瞩目。

近年来,大数据和 AI 等新兴应用催生 HPC 发生另一种变化,不同于上世纪计算机的向下平民化, HPC 向上拥抱更为复杂的业务负载,使得传统 HPC 开始向 HPDA ( High Performance Data Analytics ) 方向演进。

华为常务董事、ICT 产品与解决方案总裁汪涛

在 2021 年华为全联接大会上,华为常务董事、ICT 产品与解决方案总裁汪涛介绍了数字基础设施七大创新与客户实践,其中业界首个面向 HPDA 的分布式存储 OceanStor Pacific 引起热议,何谓高性能数据分析 HPDA,HPDA 又需要什么样的分布式存储?不妨一观。

HPDA:从数据中攫取价值

我们手中智能手机的算力,远超 NASA 在 1969 年登月计划中最先进计算机的算力,但相较于手机,HPC 所要解决业务的复杂水平,也呈现指数级发展,一大变化就是数据的爆炸式增长,使得原有 HPC 架构的存储不堪其重。

传统 HPC 主要从仿真物理模型中计算价值,需求是无与伦比的大算力,而 HPDA 泛指利用 HPC 资源的数据密集型负载,典型特点是数据量大、时效性强以及算法复杂,从数据本身提取价值,两者业务逻辑不同,导致存储需求不同。

例如地震勘探从二维向三维的演进中,数据量增加了 5-10 倍;电影渲染从 2K 升级到 8K 的革命中,数据量增长 16 倍;卫星测绘领域,探测精准度由 20 米缩小到 2 米,数据量同比增长 70 倍。海量的数据,需要高性能的存储,这是 HPC 向 HPDA 演进要解决的根本性问题。

传统 HPC 的存储主要用来文件共享、Scratch 和归档,AI 业务负载则涉及到数据收集、输入、清洗、训练、推理和归档一系列复杂操作,原有存储系统并不是为这种存储工作流程而设计的,自然也就无法很好满足新存储的需求。

在关键性能要求上,传统 HPC 负载通常基于顺序大 I/O 型,AI 业务负载需要顺序大和随机小 I/O 型的混合,用于 AI 训练的数据存取需要快速的随机小 I/O 型。

应用场景的变化催生了各种耐用性和弹性解决方案需求。例如归档需要极具高性价比的解决方案,没有苛刻的性能要求;传统的临时应用需要将临时结果转移到持久存储,需要高性能以防止出现故障;HPDA 解决方案需要混合存储需求同时满足高性能、瞬态存储和持久弹性存储的不同要求。

此外,当存储系统变得复杂化,内部多种协议发展为另一种壁垒,不同数据采用不同的访问方式,每种访问方式都需要独特的协议支持,横亘在业务负载中消耗通信时间和计算资源。

据 IDC 统计,全球 67% 的高性能计算中心(HPC)已经在使用 AI、大数据相关技术,HPC 与 AI、大数据加速融合,如何从海量数据中更高效、更经济地释放更大的数据价值,成为迫切诉求,存储系统的改变至关重要。

找寻 HPDA 存储新的平衡点

HPDA 推动了存储架构的改变,从而匹配新业务负载的同步、空间分布式计算和存储需求,矛盾聚焦于不同 I/O 模型、支持多协议访问、各种数据访问频率、高密度高效设计等方面,归根究底是找寻存储性能、成本和效率新的平衡点。

OceanStor Pacific 存储新品于 2021 华为全联接发布

华为发布了 Huawei OceanStor Pacific 9950、Huawei OceanStor Pacific 9550 两款新品,华为 OceanStor Pacific 系列高性能分布式存储,就是为打破 HPC 产业三重壁垒量身打造的 HPDA 存储系统。

第一重壁垒是高性能,HPC 在不同流程阶段面临带宽型、OPS 型业务负载需求,HPDA 场景下这一情况会更加常态化,传统存储仅支持单一负载模型,形成了性能孤岛,使得流程间的数据需要在不同存储间迁移,降低了整体流程效率。

华为技术专家夏飞博士介绍,华为 OceanStor Pacific 系列存储搭载新一代分布式文件系统,一套存储即可实现 2 倍大文件高带宽,5 倍小文件高 IOPS 性能,大大提高性能水平,同时该文件系统也能支持多种业务负载,既能兼顾客户原有的常规业务,也能很好适配企业对大数据和 AI 等新业务的探索,实现面向混合负载的全场景加速。

第二重壁垒是多协议无损互通,在以自动驾驶为代表的 HPDA 场景中,不同的流程阶段可能用到文件、大数据、对象多种服务,如何实现流程的高效数据访问成为用户面临的一大挑战。

华为 OceanStor Pacific 系列存储能够匹配多样化算力需求,一套系统支持多种协议,实现数据互通,减少中间环节,并且资源统一管理和运维,支撑业务敏捷响应。

第三重壁垒是大容量,随着 HPDA 的快速发展,海量数据的价值被进一步挖掘,用户愿意更长更久地保留数据,这对机房空间、功耗、存储成本都提出了新的挑战。

基于这种挑战,华为 OceanStor Pacific 全新推出了系列化超高密硬件,支持不同硬件间的数据自动分级,单位空间容量提升 20%,全面降低 HPC 场景的存储成本。华为 OceanStor Pacific 系列高密大容量产品在 5U 空间里支持 120 个 3.5 寸硬盘,通过高密实现 60% 以上的机柜空间节省,让海量数据不再成为负担。

越是基础的,越是核心的

中石油东方物探正行进在通过 HPDA 挖掘数据价值的路上。

自 19 世纪 40 年代至今,人类为探寻石油和天然气能源用上了最先进的理论和技术,其中高性能计算必不可少,在油气地震勘探数据采集、处理、解释的三大环节中,都需要大量的高性能计算、海量数据分析等平台,不同架构和规模的数据存储在不同系统部署,数据需要在和平台之间频繁传输拷贝,产生了额外的花销和不必要的时间损耗。

中石油东方物探有限责任公司教授级高级工程师、数据中心原总工程师赖能和在会上讲到,以中东某探区为例,3259 平方公里三维地震勘探,190 万个激发、采集数据量 1049TB。东方物探用了近 12 个月时间顺利完成数据处理任务。据了解,这也是目前为止已完成的单体数据量最大的油气地震勘探数据处理项目。

OceanStor Pacific 存储助力油气勘探

要支持如此之大的数据处理,东方物探选择了规模化集中部署华为 OceanStor Pacific 存储系统,其天然适合 HPDA 的设计在勘探场景下最大化程度得到发挥,不仅解决油气地震勘探不断增长的海量数据对存储容量的巨大需求的挑战,而且还可以保证存储性能和容量的线性增长,同时简化 IT 基础设施的复杂度,又可减少 IT 日常运维的工作量。

" 华为 OceanStor Pacific 存储支持系统间远程直接访问、混合负载和多协议互通等功能,可大大减少数据拷贝时间和拷贝次数;同时满足大文件高并发、高带宽、小文件高 IOPS 的性能平衡要求;可实现一套存储同时供高性能计算、人机交互、资料解释、数值模拟、人工智能等多个不同技术应用平台共享。存储资源利用率提高 30% 以上;生产效率提升 15% 以上。" 赖能和补充道。

越是基础的,越是核心的,不论是 HPDA 所要解决的问题,还是存储技术的突破,都再次证明了这一论断。

不止于油气勘探,从基因测序到自动驾驶研发,从天气预报到生物制药等等,这些场景要么是全新诞生的复杂业务,要么是旧技术难以解决的老大难问题,他们存在一个共性——关乎国计民生,解决问题之道在于底层基础技术的突破。

华为 OceanStor Pacific 存储支持着最顶尖的科研项目,同时这些科研项目的成果又让最广泛的人群受益,天气预报的及时预警,新药的快速开发,自动驾驶车辆的算法升级,存储的升级换代成为数字基础设施革命的必要因素,其带来的结果变化一点点传导到普罗大众的感知。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App

以上内容由"钛媒体"上传发布 查看原文
一起剪

一起剪

ZAKER旗下免费视频剪辑工具

一起剪

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容