
作者 | 陈骏达
编辑 | 云鹏
智东西 5 月 21 日报道,今天,华为在法国巴黎举办的创新数据基础设施论坛上,集中展示了面向 AI 时代的数据基础设施最新解决方案,并提出从 " 高可用 " 迈向 " 高韧性 " 的数据基础设施新理念。
华为公司副总裁兼数据存储产品线总裁袁远系统阐述了企业构建私有 AI 堆栈的五层架构需求,梳理了华为面向超大规模数据中心的 OceanStor Pacific 系列存储、上下文记忆存储平台 CMS、一站式模型工程平台 ModelEngine 以及智能体开发平台 Nexent 等全栈解决方案。
针对数据基础设施韧性,华为法国数据中心解决方案 CTO Benoît Fix 认为,传统灾备设计已过时,企业面临 AI 供应链风险、微服务脆弱性及灾备测试滞后三大新风险。他介绍了华为的 "0135" 智能运维框架,并强调在智能时代,唯一可以确定的就是数据基础设施的韧性。
华为菲尔茨研究中心首席存储科学家 David Slik 则分享了华为数据存储技术的未来演进方向,包括高带宽闪存(HBF)、存储 - 计算 - 网络融合、新型 AI 接口(知识服务与记忆服务)、统一权限系统等六大重点攻关技术,旨在构建可解释、可逆和受约束的 AI 系统。
此外,来自挪威国家图书馆、法国零售巨头欧尚、法国电信运营商 Orange、国际自然保护联盟等企业、机构的嘉宾也分享了与华为长期合作、共同构建数据基础设施的实践经验。
一、AI 驱动数据黄金时代,华为已覆盖企业 AI 五层堆栈
开幕环节中,华为执行董事、ICT 业务集团 CEO 杨超斌通过视频发表了开幕致辞。他认为,AI 正在驱动一个数据的黄金时代,token 经济全速推进,而数据是基础。
杨超斌称,数字化的深度将决定智能化的高度,全闪存存储将成为 AI 数据中心标配,数据范式正发生根本性转变,以支持大模型的发展。


他认为,AI 正从训练时代转向推理及智能体时代。全球已有超过 3000 万个 AI 智能体在协同工作,预计到 2030 年这一数字将超过 22 亿。AI 正从后台效率工具,转变为面向员工、客户和伙伴的数字体验提供者,乃至商业模型本身。到 2029 年,企业 AI 投资将增长到千亿美元规模。

华为公司副总裁兼数据存储产品线总裁袁远系统阐述了如何构建面向 AI 时代的就绪数据基础设施。
他观察到,Token 正成为一种新的信用形式。OpenAI 的报告显示,该公司的 Token 处理量在一年间从每分钟 60 亿个跃升至 150 亿。这意味着 AI 从根本上改变了我们的日常生活,也改变了我们的商业模式和日常运营。


而在计算层,企业需要 GPU、NPU 等异构算力。AI 数据平台层是承载关键业务的核心环境,需要高性能知识库、可大幅节省首 Token 时延与成本的 KV 缓存,以及让智能体越用越聪明的记忆系统。在最底层,企业需要打造数据湖层。
华为目前在上述五层都可以提供解决方案。
在数据湖层,华为的 OceanStor Pacific 系列产品面向需要处理超大规模数据的客户,系统可从几 TB 扩展至 9000 PB,单机柜容量达 100 PB,拥有业界最高的密度与最低的单位功耗。
在这一层华为还提供提供跨数据中心的统一管理工具,实现全局数据可见性,支持百万级文件秒级呈现,数千亿文件秒级定位,支持向量维度检索,可实现图搜图、视频搜图、图搜文等跨模态搜索。

华为的解决方案是业内首个能连接异构计算系统(英伟达、华为、AMD 等不同厂商的 AI 卡)的架构,单卡性能达 50 GB/ 秒,聚合性能可达 10 TB/ 秒。

在模型引擎层,华为通过核心产品 ModelEngine,为客户提供一站式模型工程化平台,帮助用户将模型部署到生产环境。
该平台具备全生命周期工具链,涵盖模型优化、对齐、权重调整、量化与评估等关键环节;预置超过 30 个流行模型,实现开箱即用;并设有模型网关作为统一入口,连接模型与外部资源。
同时,ModelEngine 支持智能资源调度,能够细粒度、按需分配 GPU 资源,并根据需求动态切换或关闭不同模型,从而最大化 GPU 利用率、有效降低成本。

平台内置自我演进框架,可推动技能与提示词的持续优化;同时提供强安全隔离区域,将运行环境与其他资源进行物理或逻辑隔离,并在各层面嵌入针对误用、数据投毒、篡改及勒索软件等威胁的防御技术,实现多层次的主动安全防护。
袁远总结道,AI 的第一章是算力,第二章是模型,而第三章是智能体。第四章将是数据,数据 " 将最终决定你的 AI 能力与安全 "。
二、从 " 高可用 " 到 " 高韧性 ":华为应对 AI 存储三大新风险
当前,数据基础设施正从追求 " 高可用 " 转向追求 " 真正的高韧性 "。
华为法国数据中心解决方案 CTO Benoît Fix 在演讲中直言,过去两年 IT 行业经历了深刻变化,传统基于单一站点、单一应用的灾备设计思路已经过时。
他说道:" 如今,我们的应用和服务跨越多个城市、多个国家、多个区域部署,是真正的跨地域协作,灾难恢复能力已不能再简单等同于可用性。"

其次是容器化与微服务架构带来的脆弱性。" 一次单一微服务的故障,就可能演变为整个业务的中断," 他举例说,近期引发全球关注的重大互联网事故即是明证。
最后,也是最为关键的一点:用户的灾难恢复能力测试普遍滞后。



此外,面对攻击者同样利用 AI 分析漏洞、开发定制化攻击代码的新形势,华为为其 OceanProtect X8100/9100 专用备份存储打造了多层协同防护体系:从快速备份、入侵分析,到具备 " 洁净区 " 气隙隔离的复制方案,最终确保存有一份绝对安全的数据副本。

华为为此开发了名为 DataMaster 的新智能运维 Agent,能从容量规划、性能监测到风险预警,实现从人工经验驱动到数据驱动的转型。

三、构建可解释、可逆、受约束的 AI 系统,六大技术方向布局未来
华为菲尔茨研究中心首席存储科学家 David Slik 分享了华为在数据存储领域的技术探索与未来演进方向。
Slik 称,从生成式 AI 的初步实验、聊天机器人等应用部署,到如今关键业务场景的真实落地,AI 应用才刚刚开始。
除了生成式 AI,能够感知并响应环境的 " 物理 AI" 正在兴起,最典型的应用是自动驾驶。同时,组织内部人与技术的边界日益模糊,智能体能力增强,可自主承担更多任务,逐渐成为工作中的 " 伙伴 "。

在这一趋势下,数据存储处于核心位置。数据用于训练模型,针对业务场景微调模型,增强推理所需的上下文,引入实时感知,并保存所有运行记录。存储承载着反馈闭环,而反馈闭环正是价值来源。
随着 AI 从内容生成走向任务自动化,再到企业级自主运行,数据存储也必须从单点支持,演进为支撑智能体协同、执行、评估、反馈、审查与观察的核心角色。Slik 强调,当前最具价值的智能体部署模式之一,就是参照人类组织的运作方式,让 AI 智能体融入其中。
他重点分享了三个正在研究的关键挑战及应对方向:
首先是效率与成本。企业在 AI 落地后常常面临高昂账单,难以规模化。Slik 称,软硬件深度整合的存储技术可显著降低硬件自身及运行过程中的能耗,并且随着上下文长度增加,这一优势更为明显。要让 AI 更准确、更可靠,需要引入更多上下文信息,而存储正是保存上下文的基础。通过存储避免重复计算,可直接应对成本与能耗挑战。



高带宽闪存(HBF)技术让 NAND 闪存和数据存储更靠近 AI 加速器,在实现大规模并行 I/O 吞吐、增加容量和降低成本三方面同时取得突破,不仅能支持更长上下文,还通过减少数据搬移降低能耗,并让 AI 加速器成为存储系统的有机组成部分。
存储、计算与网络融合技术消除了多套重复网络的复杂性和成本。存储可直接通过高性能、低延迟的统一网络连接 AI 加速器,省去大量低效协议转换、内存拷贝和队列等待,实现更快的 AI 处理和更低能耗。


在安全方面,华为正研发统一权限系统,确保无论通过数据库、文件系统还是 AI 知识系统访问,数据访问控制都能一致执行。智能体状态事务引擎可暂时保留中间状态,用于实时监督分析、问题检测以及主动回滚和恢复。

最后,Slik 强调了六大重点攻关方向:缩小 HBM 与 NAND 之间的差距,将高带宽闪存应用于更多 AI 负载;应对数据 " 太珍贵不能删、太昂贵难以存 " 的矛盾,在归档存储容量和成本上寻求重大突破;把数据处理和存储能力延伸进网络本身;防止知识表示过程中的数据无序复制和格式混乱,避免降低准确性;持续探索知识图谱与细粒度安全的最佳实践;增强不同负载下存储生命周期的可见性,使存储成为可预测的消耗品。

在 AI 时代,存储已从后台的数据仓库逐渐转变为影响智能高度的关键基础设施。它不仅是海量知识的载体,也是确保 AI 可信、高效与安全的基石。
从降低推理成本、支撑长上下文理解,到构建可解释、可回溯的智能系统,数据基础设施正成为 AI 基础设施的关键一环。