过去两年,国产 GPU 的叙事从媒体热搜走到了交易所大厅。故事的主角不再是 PPT 上的芯片渲染图,而是招股书里的现金流、研发投入,这意味着这条赛道第一次进入公开财务与公开审视的阶段:
算力不是靠情绪推进的,IPO 是把技术、供应链、交付周期和生态成熟度都写上台账。真正的国产 GPU,不只要跑 benchmark,还要跑审计、跑营收、跑交付能力。
这一批企业里,有人冲刺,比如递交招股书的沐曦、摩尔线程;有人稳着走,比如壁仞、燧原、瀚博、格兰菲。它们之间既有雄心,也有差距,有的想复刻 CUDA 生态,有的盯死 AI 推理,有的先啃工业渲染,有的在边缘算力埋伏。
不是所有公司都能笑着走完敲钟那天,但能走到现在这个阶段,本身就说明一个事实:国产 GPU 不再是 " 要不要做 ",而是 " 谁能扛住做 ",接下来几年,判断标准会更简单、更残酷。
摩尔线程,国产英伟达?
在国产 GPU 赛道上," 第一股 " 这个称号充满吸引力:不仅是资本市场的标签,更是技术叙事与战略野心的象征。
在几家传出 IPO 动作的公司里,摩尔线程看起来速度最快,10 月 30 日,官方信息显示,证监会批准摩尔线程科创板 IPO 注册。
摩尔线程成立于 2020 年,根据其招股说明书,公司拟募资规模约为 80 亿元人民币,其中将近 70 亿元将用于三大核心项目:
新一代自主可控 AI 训推一体芯片,新一代自主可控图形芯片和新一代自主可控 AI SoC 芯片。
在技术上,摩尔线程推进 " 全功能 GPU" 战略,不仅覆盖消费级图形显卡,更瞄准 AI 训练 / 推理、高性能通用计算以及云端与端侧融合架构。其创始人和联合创始团队中不少成员来自英伟达,这为其技术野心提供了强力背书。
在产品与落地方面,摩尔线程已推出四代 GPU 架构,覆盖 AI 智算、云计算和个人智算等应用领域。其 "MUSA" 架构的软件生态也有实质进展:例如其 MUSA SDK 4.0.1 版明确支持 x86 和 ARM 架构。同时,在硬件表现方面,此前有信息披露其 MTT S90 显卡在多项测试中可与 GeForce RTX 4060 竞争甚至略优,部分媒体测试显示,在《永劫无间》4K 场景下,S90 帧率略高 RTX4060。

从商业路径来看,摩尔线程走的是 " 高启动+快扩张 " 的节奏:
先大额募资、再布局自主 GPU IP 和计算平台、然后建设软件与生态链。通俗来说,它不是 " 先做一块显卡赚点钱再说 ",而是先把技术平台搭起来,再谈量产、再谈市场。不过,这样的策略意味着它必须承受比多数同行更大的时间、资金与生态适配压力。
如果摩尔线程能真正将 " 全功能 GPU +生态平台 " 变为可量产、可广泛应用的现实产品,那么它很可能成为国产 GPU 赛道的领跑者,在这些 " 赌注 " 以及技术路线选择上,它的确给人呈现出对标英伟达的意味。
沐曦股份,国产 AMD?
沐曦股份成立于 2020 年 9 月,2025 年 6 月 30 日,公司向科创板提交招股书,拟募资约 39.04 亿元人民币,主要用于新型高性能通用 GPU、人工智能推理 GPU 研发与产业化,以及面向新兴应用场景的高性能 GPU 技术研发。到 2025 年 10 月 24 日,沐曦股份的 IPO 申请在上市审核委员会审议中通过,这标志其向上市发射台迈出关键一步。
技术方面,沐曦股份并不满足于仅做显卡渲染,它的目标是打造一个通用 GPU 体系:涵盖图形渲染、通用计算、AI 训练与推理。
其招股书中提到,公司已在通用 GPU 、安全算力、异构计算平台等方向持续投入,表示拥有可在国家人工智能公共算力平台、运营商智算平台、商业化智算中心应用的能力。此外,其产品已在部分行业客户中实现量产,并在手订单亦达数十亿元,为其 " 从研发走向量产 " 提供了初步佐证。

与此同时,公司也必须面对尚未盈利、亏损规模巨大、生态建设仍待完善的现实:据披露,2022 年、2023 年、2024 年营收分别为 42.64 万元(0.0043 亿元)、0.5302 亿元、7.43 亿元;净利润亏损依次为 7.77 亿元、8.71 亿元、14.09 亿元,逐年扩大。
总的来看,沐曦给自己设定的路线也是清晰且方向坚定,其路径类似 AMD 从显卡延伸到通用计算。如果它能把通用 GPU 变为可量产、可市场化、可生态化的产品,那么在国产算力底座建设中就可能占据一席。
沐曦股份和摩尔线程全力争夺 " 国产 GPU 第一股 " 的头衔时,壁仞、燧原、瀚博、格兰菲四家企业,各自选了截然不同的道路。
壁仞科技:不做 " 桌面显卡热身 " 的公司
壁仞科技成立于 2019 年,总部位于上海,是一家专注于通用 GPU 及数据中心智能计算的公司,其战略定位明确:聚焦云端训练与推理,而非传统桌面显卡市场。公司自成立之初即将 " 训/推 一体、面向数据中心 " 定为主线。
其首款通用 GPU 芯片 BR100 于 2022 年 8 月亮相,采用原创架构,国内首批运用 Chiplet 封装技术与 2.5D CoWoS 封装,同时支持 PCIe 5.0 和 CXL 互连协议。业内认为,这些技术组合是大模型训练与多卡集群场景中 " 多卡互联 "" 长时间不掉链路 " 的核心门槛。
在生态与产品部署层面,壁仞的选择是,先尝试解决更为耗时的环节:驱动/软件栈、框架兼容、集群级别验证。例如壁砺系列通用 GPU 产品支持业内主流的深度学习框架与模型,能够为广泛的 AI 计算场景提供高能效比、高通用性的强大算力。
这几年壁仞在资本动作上,也像一个长期工程项目那样。2024 年 9 月,其在上海证监局完成 A 股上市辅导备案登记,券商为国泰君安证券。公司此前已完成多轮融资、公开融资总额超过 50 亿元人民币,估值约 140 ~ 155 亿元人民币。与此同时,公司也在推进港股上市路径,希望兼顾国内国际资本平台。
燧原成立于 2018 年,比壁仞更早,路线也更单一:只做 AI 训练加速卡,没有转向消费卡或图形业务。它的逻辑很直白——大模型训练是未来确定性最高的算力需求,把所有资源压在一条线。
技术上,燧原从 T10 迭代至第二代云燧 T20 训练卡,聚焦大模型训练需求:基于自研邃思 2.0 架构,优化 BF16/INT8 算力,搭配 64GB HBM2E 显存,单卡支持百亿参数训练、多卡可扩千卡集群,核心是无需改动训练流程即可适配,定位 " 加速器 + 编译器系统 " 而非全场景 GPU。第二代产品之后,燧原正在推进新一代推理加速卡架构路线(" 邃思 3.0")。重点仍然是实时性、能效比、低精度算子优化和多场景部署能力,并持续适配 vLLM、TGI 等主流推理引擎。官方尚未公开最终产品命名与规格,但方向明确:在大模型推理主战场构建长期竞争力。
商业化上,燧原先去云厂、科研机构做集群,强调真实 workload 压力测试,而不是 Demo。自研软件栈更贴近本土 AI 工程团队的需求。风险在于单线押注:训练市场周期性强,扩品类和现金节奏需要同步跟上。
IPO 路线同样稳,2024 年与中金签署辅导协议,估值约 160 亿人民币,腾讯持股超过 20%。2025 年 11 月 1 日重启上市辅导,并将辅导机构由中金变更为中信证券
瀚博的路径比同类更宽,也更务实:先在数据中心推理和特定 AI 加速场景站住,再逐步扩向更高通用性。它希望先把推理卡矩阵铺上:低功耗、多 SKU、适配多行业框架。
其技术语言更多是 "AI 加速器 + 可编程架构 + 多形态卡产品 ",而不是单一 GPU 叙事。从兼容性路线看,它优先做模型部署可控、资源调度可控、功耗成本可控,先成为一家 AI 工业应用一线的体系公司,它的挑战是典型中型厂商难题:软件栈深度 vs 产品线宽度。
2025 年 7 月启动 A 股上市辅导,辅导机构为中信证券。在国产算力里,瀚博是一种稀缺角色:慢是风险,也是护城河。
格兰菲:从底层做起
格兰菲不是 " 训练型 " 叙事,也不走 " 图形→ AI" 常规路线,它更像是在系统软件与 GPU 微结构之间搭建桥梁的公司。体量小,但目标并不轻:在资源受限时把 GPU 做成一个能跑 OS、能跑桌面、能跑工业应用的计算单元,而不是 " 只能在某类模型上亮分数 " 的加速器。
它的优先级顺序与大多数同行反着,没有从算力曲线出发,选择了从驱动、显示、多媒体、内核接口、兼容层这些底板工作切入。先让 GPU 能在真实操作系统环境里 " 活得像个设备 ",再讨论算力扩展。这意味着周期长、节奏慢,但内层工程密度高,几乎没有 " 捷径 " 成分。
在产品规格上,它刻意避开旗舰路线,选择中规格、多 SKU、快速验证迭代节奏,确保每一层软件栈都能被真实用户检验。市场策略类似 " 样机时代的英伟达 ":先做小规模部署,靠真实 workload 反向塑造硬件需求。
转型 AI 是它的下一步,这里它跑得不激进,但逻辑清晰:先做底,再上层。2025 年 2 月启动 A 股辅导备案。格兰菲这种公司不会一夜爆火,但一个完整的国产体系里,它不能消失。


