" 国产 GPU 第一股 " 之战已经打响。
作为 " 国产 GPU 四小龙 " 的摩尔线程智能科技(北京)股份有限公司(下称 " 摩尔线程 ")、沐曦集成电路(上海)股份有限公司(下称 " 沐曦集成 ")科创板 IPO 均已先后获得受理。
同时,GPU 大厂壁仞科技、燧原科技、格兰菲智能科技股份有限公司则处于 IPO 辅导阶段。
这意味着," 国产 GPU 四小龙 " 都踏上了资本化之路。
其中摩尔线程无疑是最为受瞩的存在。
摩尔线程的核心团队成员基本来自英伟达,旗下的 MTT S80 显卡的单精度浮点算力性能接近英伟达 RTX 3060,自建的千卡 GPU 智算集群效率超过同等规模国外同代系 GPU 集群。
2024 年,摩尔线程收入已经达到 4.38 亿元,同比增长了超 2 倍。
但由于同期研发费用仍达到 13.59 亿元,造成的净亏损仍达到 14.92 亿元,但同比已减亏 1 成左右。
摩尔线程计划募资 80 亿元,投向 AI 训推一体芯片、图形芯片和 AI SoC 芯片的研发。
这是今年上半年科创板新增 IPO 项目中最大的一笔募资规模。
同期获得受理的沐曦集成 IPO 募资额只有摩尔线程的一半左右。
谁将成为 " 国产 GPU 第一股 ",市场正在翘首以待。
新品 " 崭露头角 "?
从产品布局来看,摩尔线程属于 " 全能型选手 "。
品类涵盖 AI 智算、专业图形加速、桌面级图形加速和智能 SoC,可以满足政府、企业和个人消费者的需求。
AI 智算类产品包括训练智算卡、推理卡、超节点服务器及夸娥智算集群等。
该大类产品在 2024 年首度实现零突破,创收 3.36 亿元,占比超过 7 成。
这一方面受益于市场对大模型训练、推理部署等场景的需求快速增长;
另一方面,这和产品落地时间有关。摩尔线程直到 2023 年才推出可提升 AI 训练和推理能力的第三代 GPU 芯片,并基于此搭建了千卡集群智算中心。
目前摩尔线程的代表性产品之一 MTT S4000,正是在 2023 年底推出的训推一体全功能智算卡。
虽然 MTT S4000 和英伟达的 H100 仍存在较大的差距,但摩尔线程已经对其进行迭代,并在此次招股书中首度披露新品 "MTT S5000" 对标 H100 的粗略数据情况。
摩尔线程称 MTT S5000 可通过 FP8 精度支持等创新提升性能。
其中,FP(Floating Point)是标准浮点数类型。作为衡量算力性能的指标之一,FP 一般可分为 FP8、FP16、FP32 等,FP 标注数值与精度成正比。
在终端场景的应用中,虽然精度越高会带来更高的准确性,但同时还会带来能耗、内存、计算效率的压力。
理想的目标是保持低精度的同时还能实现准确性、效率、内存、能耗的平衡。
FP8 是目前深度学习领域较为新型的低精度浮点格式之一。虽然 FP8 相较于此前的 FP32 格式精度较低,但部分企业目前通过特殊处理已经可以实现以微小的精度损失换来高效的运算和更低内存占用。
例如 DeepSeek V3 便引入了 FP8 混合精度训练框架,首次在超大模型验证了其有效性。
" 通过支持 FP8 计算与存储,我们既实现了训练加速,又降低了 GPU 内存占用。"DeepSeek 团队在 V3 开源报告中指出," 与 BF16 基线相比,我们 FP8 训练模型的相对损失误差始终保持在 0.25% 以下,这个水平完全在训练随机性的可接受范围内。"
不过目前摩尔线程仅披露 MTT S5000 在 FP32 指标中与国际大厂的差异。
MTT S5000 的 FP32 算力性能为 32TFLOPS,高于英伟达 A100 的 19.5TFLOPS,但低于英伟达 H100、AMD 的 MI325X,二者分别为 67TFLOPS、163.4TFLOPS。
尽管 FP32 不是唯一的性能指标,但可以看出 MTT S5000 的算力性能较上一代的 MTT S4000 已有所升级,后者的 FP32 仅为 25TFLOPS。
不仅如此,摩尔线程基于 MTT S5000 还构建了千卡 GPU 智算集群,效率超过同等规模国外同代系 GPU 集群。
此番 IPO,摩尔线程的目标之一就是投资 25 亿元新建 " 新一代自主可控 AI 训推一体芯片研发项目 ",包括引入先进工艺、先进封装等,预计建设周期为 3 年。
市场期待更多商业化成果可以得到实现。
商业策略转向
尽管品类涵盖 B 端和 C 端,但摩尔线程目前整体的收入规模仍不敌沐曦集成。
2024 年,摩尔线程 4.38 亿元的收入仅为沐曦集成 6 成左右。
这或许和二者的商业化策略差异有关。
摩尔线程聚焦全功能 GPU 产品的开发,即兼具功能完备性与精度完整性。
一方面,摩尔线程的单一 GPU 集成了 AI 计算加速、图形渲染、物理仿真和科学计算等多种功能;
另一方面,GPU 还支持 FP64、FP32 等不同计算精度,满足终端场景的个性化需求。
虽然 B 端和 C 端两手抓,但摩尔线程在开拓 C 端市场上略显 " 吃力 "。
摩尔线程推出的 MTT S80/S70 系国内首款消费级 GPU 产品,可以兼容多款游戏。其中 MTT S80 的 FP32 算力性能接近英伟达的 RTX 3060。
但 2022 年至 2024 年,包括 MTT S80/S70 等消费级 GPU 等在内的桌面级图形加速产品收入合计仅为 0.72 亿元。
不仅如此,由于这类产品市场竞争激烈,导致摩尔线程不得不采取低价策略—— 2023 年、2024 年单价分别仅为 537.52 元、884.61 元。
这甚至无法覆盖成本。同期毛利率分别为 -103.74%、-15.87%。
" 桌面级图形加速产品毛利率为负,主要由于中低端市场面临国际品牌的激烈竞争,导致公司产品销售价格存在一定压力。" 摩尔线程指出。
相比之下,沐曦集成的 GPU 主要聚焦市场增长较快的人工智能训练和推理、通用计算与图形渲染领域,集中在 B 端市场,商业化成果兑现较快。
面对商业化进展迟缓的消费级产品,摩尔线程正在转变自己的策略,更加聚焦于专业图形加速、AI 智算的 B 端产品。
" 面对国际知名公司的成熟产品,公司芯片、板卡产品销售价格存在一定压力。随着产品不断发展,公司逐步拓展专业图形加速、AI 智算等高性能、高毛利领域产品,毛利率逐渐上升。" 摩尔线程指出。
摩尔线程在专业图形加速、AI 智算领域确实能够斩获更为可观的毛利,2024 年 AI 智算、专业图形加速的板卡毛利率分别高达 90.7%、83.13%。
同期,沐曦集成的训推一体、智算推理的板卡毛利率则分别为 63.5%、10.09%。
随着商业策略的转变,摩尔线程有望迎来扭亏时刻。目前管理层预计最早可在 2027 年实现盈利。
已披露金额的在手订单中,摩尔线程已有 4.4 亿元销售合同正在履行中。
市场期待摩尔线程能够早日在终端市场占有一席之地。