关于ZAKER Skills 合作
全天候科技 21分钟前

AI 数据中心连接之战:铜退光进是真的吗 ? CPO 时代供应链利润分配有什么变化?

铜与光在 AI 数据中心内的长期角力正迎来关键转折,但 " 铜退光进 " 的叙事远非真相全部。

Bernstein 最新白皮书指出,随着 AI 集群规模迅速扩大,连接能力正成为影响系统性能与成本的核心瓶颈,也成为产业竞争的新焦点。未来多年,铜互联与光互联并非此消彼长的替代关系,而将在不同距离和应用场景中长期共存,并分别沿着 "Scale-up" 与 "Scale-out" 两条路径持续演进。

英伟达与博通正推动 CPO 从概念走向商业化。英伟达明确表示,其 CPO 交换机将于 2026 年下半年小规模部署,CoreWeave 与 Lambda 等 AI 云服务商为首批使用者。但因制造、封装与测试复杂度高,2026 — 2028 年间,超大规模云服务商仍将以可插拔光模块为主流。同时,铜互联凭借成本、功耗与成熟度优势,在 Scale-up 场景中的主导地位至少延续三年。

CPO 的真正意义在于重构产业链价值分配。Bernstein 测算,CPO 光引擎与激光器成本较 1.6T 可插拔模块均价高出约 10%,但利润重心将从传统光模块厂商转向芯片制造与先进封装。

这一升级也将带动基础材料领域,如高阶 PCB、ABF 载板、T-glass 玻纤等迎来结构性增长。但随着新产能集中释放,自 2026 年底起,价格竞争、折旧上升与供给扩张将逐步压缩盈利空间。投资者应聚焦在技术、制造与供应链控制上具备领先能力的企业。

铜与光各司其职,Scale-up 与 Scale-out 路径分明

AI 基础设施的扩张主要沿着两条路径展开:Scale-up 与 Scale-out。

Scale-up 是在单一系统内部不断增加计算资源,例如在同一机柜或节点中部署更多 AI 加速器,以提升单个训练任务的计算效率;Scale-out 则通过连接更多机柜和服务器,将数据中心扩展为更大规模的计算集群,以提升整体容量和吞吐能力。

大型语言模型训练高度依赖张量并行(Tensor Parallelism)和专家并行(Expert Parallelism)等技术,需要在紧密耦合的 Scale-up Pod 内进行频繁的数据交换。这使得 Scale-up 场景对延迟和带宽的要求远高于 Scale-out。目前,铜互联凭借成本低、功耗小和技术成熟等优势,仍是机柜内部连接的主流方案。在英伟达的 GB300 NVL72 架构中,Superchip 与交换芯片之间的高速通信依然主要依赖铜缆完成。

相比之下,光互联在长距离、高带宽传输方面优势更加明显。随着单通道速率提升至 224Gbps 及以上,光模块能够在 10 米甚至更远距离上实现低损耗传输,并支持太比特级扩展,因此已成为 Scale-out 架构中机柜间互联的核心技术。

LightCounting 的数据显示,2025 年全球光收发器及相关产品销售额已超过 230 亿美元,同比增长约 50%;其中,以太网光收发器市场规模约 170 亿美元,同比增长 60%。该机构预计,2024 年至 2026 年,以太网光收发器市场将保持约 59% 的年复合增长率;到 2026 年至 2030 年,随着市场逐步成熟,增速将回落至 15% 左右。

这意味着,未来 AI 数据中心的连接架构并非 " 铜被光取代 ",而是在不同层级形成清晰分工:铜互联继续主导短距离、高密度的 Scale-up 场景,光互联则支撑长距离、高带宽的 Scale-out 网络。两种技术将在未来多年内并行发展,共同构成 AI 基础设施扩张的核心底座。

CPO:从概念到落地的现实挑战

共封装光学(CPO,Co-Packaged Optics)通过将光引擎直接集成到 XPU 或交换芯片所在的基板上,省去传统光模块中的 DSP,使数据能够通过更低功耗的 SerDes 直接传输。这种架构显著缩短了电信号路径,被视为下一代高速互联的重要方向。

英伟达表示,其 CPO 交换机相比传统可插拔光模块可实现约 3.5 倍的能效提升、63 倍的信号完整性改善,以及 10 倍的网络韧性提升。博通则指出,采用 CPO 后,每比特的光学成本有望下降约 40%。

不过,CPO 距离全面普及仍面临诸多现实挑战。制造良率、测试复杂度、光纤耦合精度,以及云服务提供商对可维护性和供应商集中度的担忧,都是重要障碍。由于光器件被封装在交换机内部,一旦出现故障,通常需要更换整台交换机或返厂维修,停机时间明显长于传统方案。相比之下,可插拔光模块可以由数据中心运维人员现场快速更换,对业务影响极小。

基于这些限制,Bernstein 预计,CPO 在 Scale-out 网络中的小规模部署将于 2026 年下半年启动,主要目的是验证实际性能并测试供应链成熟度。率先采用的企业预计包括 CoreWeave 和 Lambda 等 AI 云服务商。

在更关键的 Scale-up 场景中,CPO 进入时间可能进一步推迟至 2028 年下半年之后。原因在于,行业需要先在交换机侧充分验证其长期可靠性,才会将这一技术应用于价值更高、容错要求更严苛的 XPU 系统。

LightCounting 预计,CPO 真正的大规模出货将在 2028 年以后才会出现。在此之前,线性可插拔光学(LPO,Linear Pluggable Optics)可能成为更现实的过渡方案。LPO 通过取消 DSP,将信号处理交由线性组件完成,可将功耗较传统可插拔模块降低约三分之二,同时保留模块化设计带来的维护便利。

Bernstein 认为,到 2030 年前,LPO 的出货规模有望超过 CPO。这意味着未来几年,数据中心光互联的主流方向并非一步迈向共封装,而是在可插拔、LPO 和 CPO 三种架构之间逐步演进。

CPO 改写价值分配:利润从模块厂商转向芯片与封装

英伟达 Quantum-X800 CPO Switch 的成本结构拆解,清晰地指向一个结论:共封装光学技术正在深刻改写产业链的价值分配规则。

根据测算,该交换机配置 4 颗交换 ASIC,每颗 ASIC 周围集成 18 个光引擎,整机共配备 18 个外置光源模块。每个光源模块包含 8 个连续波(CW)激光器,为所有光引擎提供稳定的激光输入。按此架构估算,单台 Quantum-X800 CPO 交换机的总成本约为 57 万美元。

从定价结构看,CPO 中的光引擎与激光器组合,其平均售价(ASP)至少比 1.6T 可插拔光模块高出 10%。这一比较已考虑传统光模块厂商约 40% 的毛利率,以及 CPO 系统厂商约 50% 的毛利率。换句话说,CPO 不仅没有降低整体价值量,反而通过更高集成度创造出更大的单机价值。

更重要的是,CPO 改变了产业链中的利润归属。传统可插拔光模块的价值主要集中在模块厂商手中,其中 DSP 和其他电芯片构成了重要成本组成。而在 CPO 架构下,DSP 被取消,光引擎直接与交换芯片共同封装,价值重心因此向芯片设计、先进封装和晶圆制造环节转移。

这意味着,英伟达、博通、台积电以及各类 OSAT(外包半导体封装测试)厂商,将成为 CPO 时代的核心受益者。与此同时,上游关键零部件供应商也有望分享增长红利,包括 Lumentum、Coherent 等光器件企业,以及 Chroma ATE 等测试设备厂商。

相比之下,传统光模块厂商在 CPO 和未来 NPO(Near-Packaged Optics)架构中的角色将被结构性削弱。随着封装和系统集成成为核心竞争力,行业利润将不再主要集中于收发器组装环节,而是向掌握芯片设计、先进制造和系统整合能力的企业集中。

全天候科技

全天候科技

提供专业快速完整的科技商业资讯

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容