关于ZAKER Skills 合作
钛媒体 28分钟前

从“可用”到“好用”,国产算力跨越了吗?四小龙财报背后的喜与忧

2025 年 12 月至 2026 年初,短短一个多月内,摩尔线程、沐曦股份相继登陆科创板,壁仞科技、天数智芯扎堆港股挂牌。四家头顶 " 国产 GPU 四小龙 " 光环的企业集体完成资本化跨越,合计募资规模超百亿港元。国产算力芯片赛道,终于从漫长的 "PPT 造芯 " 阶段,迈入了接受财报检验的 " 交卷时刻 "。

国产算力的 2025 年,是一场关于 " 证明 " 的年份——证明国产 GPU 可以规模化量产,证明万卡集群能够稳定运行,证明资本市场愿意为国产算力的未来下注,证明国产算力能撑得起万亿甚至更高的市场。

最近一段时间,多家国产芯片公司先后发布了上市后首份年度财报,综合数据来看,各家公司营业收入全线大幅增长,但集体亏损的格局也昭示着这个行业的真实处境。在 AI 算力需求从训练逐步向推理转移的大背景下,国产算力究竟走到了哪一步?

国产算力交出 " 完美 " 答卷

2025 年,沐曦股份以 16.44 亿元的营收规模领跑四小龙,同比增长 121.26%;归母净利润亏损 7.89 亿元,较上年同期大幅收窄 43.97%。公司近三年营收从 2023 年的 0.53 亿元跃升至 2025 年的 16.44 亿元,三年间收入规模增长超过 30 倍。营收增长的核心驱动力来自 GPU 产品销量的大幅放量—— 2025 年以曦云 C 系列为主的训推一体 GPU 板卡销量达 33649 片,同比增长 147.31%,截至报告期末公司 GPU 产品累计销量已超过 5.5 万颗。与此同时,沐曦依然保持高强度研发投入,2025 年研发费用为 10.27 亿元,较上年同期增长 14.04%,占营业收入比例高达 62.49%。

摩尔线程(688795)2025 年实现营收 15.05 亿元,同比增长 243.37%;毛利总额达到 9.87 亿元,较上年同期增长 218.43%;归母净利润、归母扣非净利润分别较上年同期亏损收窄 38.16%、33.38%。扣除股份支付影响因素后,2025 年净利润亏损 6.48 亿元,较上年同期收窄 8.47 亿元,收窄比例达 56.65%。同时,摩尔线程(688795)保持了高强度的研发投入,全年研发费用 13.05 亿元,占比为 86.68%。

天数智芯 2025 年实现营收 10.34 亿元,同比增长 91.6%;毛利 5.58 亿元,同比增长 110.5%,毛利增速高于营收增速,经调整净亏损约 4.38 亿元,同比收窄 32.1%。核心通用 GPU 业务全年收入 9.23 亿元,同比增长 149.6%,占总营收 89.3%。细分来看,天垓训练系列收入 5.84 亿元,同比增长 116.7%;智铠推理系列收入 3.39 亿元,同比大增 238.2% ——推理业务的爆发式增长,成为天数智芯 2025 年财报中最亮眼的注脚之一。

壁仞科技 2025 年营收 10.35 亿元,同比增长 207.2%;毛利 5.57 亿元,同比增长 210.8%,毛利率达到 53.8%。然而,公司年内亏损为 164.93 亿元,同比扩大 972.3% ——这一数字乍看惊人,但公司解释称主要与赎回负债账面值变动、股份为基础的薪酬开支以及上市费用有关;剔除这些因素后,经调整年内亏损为 8.74 亿元。研发投入 14.76 亿元,同比增长 78.5%,主要用于新一代 GPU 架构及 AI 软件平台的迭代升级。2025 年,壁仞科技完成了旗舰通用 GPU 产品 BR106 及 BR166 的全形态量产与规模交付,其中 BR166 系列于 2025 年 8 月开始量产,在不到半年的销售时间内便快速落地,成为营收跨越式增长的核心驱动力。

从行业整体来看,2025 年四家国产 GPU 厂商营业收入均大幅增长,但仍集体亏损。摩尔线程、沐曦股份、天数智芯亏损同比收窄,壁仞科技因研发开支增长等影响亏损规模有所扩大。沙利文中国咨询顾问池钰曾向媒体表示,从行业阶段来看,国产 GPU 还处在比较早期的快速发展阶段,即便是目前相对靠前的企业,与英伟达这类海外成熟厂商仍存在明显差距。

从 " 能用 " 到 " 好用 ",国产算力仍面临挑战

财报数字的火热,不能掩盖国产算力厂商正在面临的深层挑战。

这其中,最为紧要的就是提升集群稳定性和工程化的能力。大模型训练对算力集群的稳定性提出了极高要求。摩尔线程相关技术负责人坦言,用户在选择国产算力时最关心的问题中," 集群长期稳定性 " 被排在首位,其次才是 " 框架兼容性和迁移成本 " 与实际训推性能。这个排序本身就说明了一个事实:对于真正做大模型训练的企业来说,性能差一点可以接受,但训练任务频繁中断、需要反复回滚 checkpoint,可能才是真正的噩梦。

" 摩尔线程基于 MTT S5000 打造的夸娥万卡集群,浮点运算能力达 10 Exa-Flops,在 Dense 模型训练中 MFU 达 60%,在 MoE 模型中维持在 40% 左右,有效训练时间占比超过 90%,训练线性扩展效率达到 95%。" 该名负责人介绍。

但在实际行业环境中,万卡级 AI 集群的稳定性管理仍是一道高难度考题。据行业媒体披露,当前万卡级别的 AI 集群平均每天会出现一次甚至多次故障,故障来源包括 GPU HBM 显存错误、高速互联链路抖动、散热不均导致的热节流、甚至电源模块波动等。这不仅是国产算力的挑战,也是全球 AI 基础设施面临的共性难题——即便英伟达的 DGX SuperPOD,在实际运行中也难以做到完全无中断。

国产厂商在稳定性方面的劣势,更多体现在工程经验的积累深度上。英伟达在过去十年中部署了数百个大规模集群,积累了海量的故障模式和调优经验,这些 Know-How 是无法通过 " 堆人 " 快速追赶的。国产厂商往往在实验室环境下跑通了万卡互联,但一旦进入客户真实的生产环境,面对复杂的网络拓扑、混合负载调度、以及非理想条件下的长时间运行,各种 " 意想不到 " 的问题就会暴露出来。

其次,生态的建设也是国产算力老生常谈的话题。当前,国产 GPU 厂商普遍选择了 " 兼容生态 " 的务实路径。摩尔线程相关技术负责人表示,其自主研发的 MUSA 架构对英伟达 CUDA 具备优良的兼容性,通过 MUSIFY 自动移植工具,开发者能够以最小成本将国际主流 GPU 平台应用移植至 MUSA GPU,大幅提升应用移植的效率,缩短开发周期。天数智芯和壁仞科技同样在软件栈层面投入大量资源,确保 PyTorch、TensorFlow、Megatron-LM 等主流框架能够在其硬件上高效运行。

然而,兼容模式在缩短市场导入期的同时,也带来了一个结构性的困境:开发者习惯被锁定在 CUDA 生态中,国产平台始终停留在 " 生态附庸 " 的位置。更深层的问题在于,兼容路线在管理决策上看似捷径,但代价可能是沉重的:国产 GPU 厂商需要警惕永远做 " 生态跟随者 " 的风险。

英伟达的护城河从来不只是硬件算力,而是 CUDA 生态过去十五年积累的数百万开发者、数千个加速库以及海量的应用案例。要想从 " 兼容 " 走向 " 主导 ",国产厂商必须找到一种方式,让开发者愿意主动为国产平台编写原生代码、贡献开源库,而不是仅仅把这里当作 CUDA 的 " 备胎 "。

摩尔线程和沐曦股份已经意识到这一点。摩尔线程除了提供 MUSIFY 自动移植工具外,还开源了 Torch-MUSA、vLLM-MUSA 等多个软件库,试图逐步培育 MUSA 原生生态。沐曦则以 "1+6+X" 战略构建产业生态圈,以数字算力底座为核心,在六大重点行业推动国产 GPU 的深度渗透。但生态建设非一日之功,需要持续数年甚至十年的投入,以及足够的用户规模来形成正反馈循环。

" 条条大路通罗马 "

面对挑战,国产算力厂商正在用各自的方式寻找破局之路。从已披露的战略布局来看,差异化正成为这一轮竞争的主旋律,即便选择的路径不同,但他们目标却是相似的——如何提升国产算力。

壁仞科技的战略方向,可以概括为 " 系统先行,推理卡位 "。2025 年,公司交付了 2048 卡光互连光交换 GPU 超节点集群。但集群的实际运行效率和商业化落地效果,仍有待更大规模部署的检验。

在产品迭代方面,壁仞科技计划于 2026 年推出下一代 BR20X 芯片及全系列产品,在保持训练优势的同时,为推理需求进行优化——算力密度、内存容量和带宽、互连能力升级,支持 FP8/FP4 等低精度计算。截至 2025 年末,壁仞科技持有现金及金融资产共 28.96 亿元,加上 2026 年初上市募集的 56.31 亿元,账面资金较为充裕。不过,对于一家仍处于大规模研发投入期的芯片企业而言,这些资金能在多长时间内支撑其技术迭代与市场扩张,仍是外界关注的问题。

天数智芯选择了一条更具进攻性的路线。今年 1 月,公司公布了芯片四代架构路线图:2025 年天数天枢架构超越英伟达 Hopper,2026 年天数天璇架构对标 Blackwell、天数天玑架构超越 Blackwell,2027 年天数天权架构超越 Rubin,之后转向突破性计算芯片架构设计。

这一路线图的技术承诺最终需要实际产品来兑现,目前尚未有第三方基准测试数据公开验证其性能宣称。在商业化方面,天数智芯已累计服务超 340 家客户,产品及解决方案在互联网、AI 大模型、科研、金融、医疗、教育等领域部署超 1000 项。公司还推出了面向机器人、智能终端等领域的彤央系列端侧算力产品。四代架构路线图的发布与边端产品的亮相,显示出天数智芯试图在训练、推理和边缘计算三个维度同时发力。但多线作战也意味着研发资源的分散,其能否在任一领域建立足够深的护城河,仍需观察。

沐曦股份的策略则可以概括为 " 产品全栈化,生态开源化 "。在产品端,公司已形成曦云 C 系列(训推一体与通用计算)、曦思 N 系列(AI 推理)、曦彩 G 系列(图形渲染)、曦索 X 系列(科学智能)四大 GPU 产品矩阵。

2025 年 7 月,首款基于全国产工艺的曦云 C600 系列在 WAIC 大会发布,已于 2025 年末实现风险量产,预计 2026 年上半年量产销售。但需要指出的是," 全国产工艺 " 在当前语境下通常指代特定制程节点,其与行业最先进制程的性能差距,是评估产品竞争力的关键变量。面向科学智能场景的曦索 X 系列首款产品 X206 配备 128GB 超大容量显存,于 2026 年 1 月正式面世。沐曦计划 2026 年进一步推进曦索 X206、曦云 C700 等下一代产品的研发及产业化。上市募集资金净额约 38.99 亿元,将分三至四年投入新型高性能通用 GPU 研发及产业化等方向。资金分三至四年投入,意味着短期内难以看到全部成果,技术迭代节奏与市场竞争窗口的匹配度,将是其面临的主要考验。

与专注 AI 计算的同行不同,摩尔线程坚持全功能 GPU 路线,从游戏显卡到 AI 计算试图覆盖多个场景。这种路径的优势在于覆盖面广,但同时也意味着在每一细分领域都可能面临更专注竞争对手的挑战。

摩尔线程的 GPU 支持 AI 计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码,并声称是国内极少数原生支持从 FP8 到 FP64 全计算精度的厂商。在集群工程化能力上,摩尔线程已推出新一代全功能 GPU 架构 " 花港 ",可支持十万卡以上规模的智算集群扩展。其在科学计算和生物制药等垂直领域的表现尤为突出——据公司披露,在分子动力学引擎 SPONGE 中,MTT S5000 性能达到国际旗舰产品的 1.7 倍;在生物制药分子对接工具 DSDP 中,性能达到 8.1 倍。上述数据均来自公司自身披露,尚未有独立第三方在标准化测试环境下的验证结果。这种在特定垂直领域建立的优势,能否转化为可持续的商业模式,仍有待观察。

除了 " 四小龙 " 之外,华为昇腾和寒武纪同样是国产算力版图中不可忽视的力量。据行业分析机构披露,英伟达在中国 AI 加速卡市场的份额已从制裁前的约 95% 大幅下降至 55% 左右,2025 年国产厂商合计出货量达 165 万张,占比约 41%,其中华为以 81.2 万颗领跑国产阵营。寒武纪 2025 年营收达 64.97 亿元,同比增长 453%,实现净利润 20.59 亿元。这些数据表明,国产算力替代的整体进程正在加速,而 " 四小龙 " 面临的竞争格局远比想象中的更复杂——它们不仅要追赶英伟达,还要与华为、寒武纪等本土玩家同台竞技。

2026 年,对于国产算力而言,证明的阶段或许正在转向 " 超越 " ——超越的不仅是国际对手的技术指标,更是用户对国产算力的信任阈值。正如弗若斯特沙利文数据所预测的,国产通用 GPU 产品占比有望从 2024 年的 17.4% 提升至 2029 年的超过 50%。市场份额的跃迁背后,是技术、生态、工程化能力与商业模式的系统性较量。

而对于国产算力上市公司而言,上市之后的新课题才刚刚开始:如何在高强度研发投入与可持续盈利之间找到平衡?如何在兼容生态与自主创新之间走出一条独特的路?如何在训练需求与推理爆发的结构性切换中抢得先机?

(文|Leo 张 ToB 杂谈,作者|张申宇,编辑丨杨林)

相关标签

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容